摘要预测细胞对扰动的响应是药物研发的关键环节然而生物空间的组合复杂性使实验筛选受到极大限制。计算模拟虽为可扩展的替代方案但现有模型存在潜在表征不完整主要依赖高可变基因进行特征表征、全基因组重建保真度低、动态规律跨场景泛化性差等问题因此无法将学习到的动力学机制迁移至未观测的细胞背景中。为解决这些系统性缺陷本研究提出生成式虚拟细胞世界模型AlphaCell将全基因组表征与连续状态转换建模相融合。AlphaCell实现了项协同创新1潜流形校正处理全蛋白编码转录组以构建可微虚拟细胞空间在过滤噪声的同时保留细胞固有拓扑结构2生物现实重建利用大容量、富知识的解码器将抽象潜状态还原为高保真的全基因组表达谱3通用状态转换通过最优传输条件流匹配将扰动建模为连续的确定性向量场。AlphaCell将扰动机制抽象为通用的动态规律可在组合泛化场景中稳健预测细胞的扰动响应并能对完全未观测的细胞背景实现细胞动力学的样本预测为跨细胞背景的扰动预测及扰动诱导的细胞动力学模拟提供了核心基础引擎。#AlphaCell #虚拟细胞世界模型 #细胞扰动预测 #潜流形校正 #生物现实重建 #最优传输条件流匹配 #细胞动力学模拟 #零样本预测结果AlphaCell框架种虚拟细胞世界模型图1AlphaCell虚拟细胞世界模型框架及各类细胞状态转换范式(a) AlphaCell的整体架构(b-e) 现有计算范式与AlphaCell的概念对比(b) 潜算术模型如基于变分自编码器的模型假设在基于截断高可变基因的扁平笛卡尔网格中存在刚性线性向量偏移(c) 机制约束模型如基于图神经网络的模型依赖先验知识图谱指导的离散状态转换(d) 受限子空间流模型可捕捉连续轨迹但受限于基于截断基因输入的低维空间如主成分分析空间(e) 集合型基础模型映射利用变换器和最大均值差异对齐群体统计特征仅实现离散的群体跃迁无单细胞水平的连续动力学特征(f) AlphaCell构建了完整的虚拟细胞世界模型处理全基因组表达谱而不进行基因截断构建连续的可微潜流形将扰动响应建模为连续的物理流并实现高保真实建。基于全基因组蒸馏与流形校正构建连续的虚拟细胞空间图2用于构建虚拟细胞空间的AlphaCell基础模型架构及训练范式(a) AlphaCell基础模型的架构与训练流程示意图训练分为个阶段阶段1基础构建采用掩码自监督学习阶段2微调整合弧面损失和域对抗神经网络约束通过共享混合专家解码器实现高保真的全基因组重建(b) 阶段1使用的掩码语言建模头通过重建随机掩码的基因标记模型在无监督条件下学习基因共表达的基本规律(c) 阶段2使用的域对抗神经网络头将扁平化的细胞嵌入通过梯度反转层对抗性过滤技术批次特征保证虚拟细胞空间的通用性(d) 阶段2使用的弧面损失头对归一化权重施加角度间距最大化不同生物状态的可分性优化潜流形的拓扑结构。基于最优传输条件流匹配模拟细胞状态转换图3基于混合专家架构的最优传输条件流匹配实现生成式动力学模拟(a) AlphaCell流模型的架构细胞状态、时间、扰动等输入通过融合自适应层归一化、联合注意力和共享/路由混合专家的主干网络动态编码扰动特异性的动力学特征(b) 最优传输条件流匹配模型学习确定性向量场将对照组状态蓝色沿连续的测地线轨迹转换为扰动组状态橙色(c) 动态批内最优传输为处理非配对数据在小批次内实时匹配对照组和扰动组细胞群体定义最优训练轨迹(d) 联合注意力该机制基于扰动的语义特征调控细胞状态通道。组合泛化场景中扰动响应的稳健预测图4AlphaCell与主流基线模型在组合泛化任务中的性能对比包括STATE、scGPT、GEARS 及线性模型(a) OTF数据集转录因子过表达(b) Sciplex数据集化学药物扰动(c) Tahoe数据集大规模药物扰动。评估指标从个维度衡量模拟性能定量保真度皮尔逊相关系数、平均绝对误差和调控逻辑差异表达基因重叠准确率、宏F1值。差异表达基因重叠准确率衡量顶级差异表达基因的有效检索能力宏F1值评估基因上调/下调调控方向预测的正确性。HVG-高可变基因集All-全基因组基因集扰动动力学机制向完全未观测细胞背景的迁移图5AlphaCell与主流基线模型在细胞类型零样本预测任务中的性能对比(a) OTF数据集转录因子过表达(b) Sciplex数据集化学药物扰动(c) Tahoe数据集大规模药物扰动。评估指标从个维度衡量模拟性能定量保真度皮尔逊相关系数、平均绝对误差和调控逻辑差异表达基因重叠准确率、宏F1值。差异表达基因重叠准确率衡量顶级差异表达基因的有效检索能力宏F1值评估基因上调/下调调控方向预测的正确性。All-全基因组基因集详细总结思维导图整体架构大核心模块的协同体系参考Towards building a World Model to simulate perturbation-induced cellular dynamics by AlphaCell, https://doi.org/10.64898/2026.03.02.709176260302AlphaCell.pdf注AI辅助创作如有错误欢迎指出。内容仅供参考不构成任何建议。