扫码下载APP

您的位置

资讯详情

本人可编辑资讯

仅支持在APP编辑资讯扫描二维码即可下载APP

北京国家气候中心张学工在Nature Methods发表重要研究成果

论论资讯 | 2024-06-07 2953热度

Nature Methods

Explore content

About the journal

Publish with us

Large-scale foundation model on single-cell transcriptomics

Hao Minsheng; Gong Jing; Zeng Xin; Liu Chiming; Guo Yucheng; Cheng Xingyi; Wang Taifeng; Ma Jianzhu; Zhang Xuegong; Song Le

Published:2024-06-06
DOI:10.1038/s41592-024-02305-7

研究背景

在当今的生物医学研究中,单细胞转录组学已成为解析细胞内部机制的关键技术。然而,随着数据量的激增,如何高效处理和分析这些海量数据成为了一个亟待解决的问题。传统的数据分析方法在处理复杂多变的基因表达模式时显得力不从心,这限制了我们对细胞功能和疾病机制的深入理解。因此,开发一种能够处理大规模单细胞数据的新型分析工具,对于推动生物医学研究的进步具有重要意义。

研究内容

本研究在《Nature Methods》上发表,介绍了一种名为scFoundation(又称xTrimoscFoundation<sup>α</sup>)的大规模预训练模型。该模型拥有1亿个参数,覆盖约2万个基因,基于超过5000万个人类单细胞转录组数据进行预训练。scFoundation模型的特点在于其庞大的参数规模、高维度的基因数据处理能力以及庞大的训练数据量。模型采用了类似Transformer的不对称架构,并设计了专门的预训练任务,以有效捕捉不同细胞类型和状态中基因间的复杂上下文关系。实验结果表明,scFoundation在多个单细胞分析任务中表现出色,包括基因表达增强、组织药物反应预测、单细胞药物反应分类、单细胞扰动预测、细胞类型注释和基因模块推断等,达到了当前最先进的技术水平。

研究意义

scFoundation模型的开发标志着单细胞转录组学分析领域的一个重要突破。其创新之处在于,它不仅能够处理和分析大规模的单细胞数据,还能够捕捉基因间的复杂关系,为生物医学研究提供了强大的数据分析工具。此外,scFoundation的成功应用展示了预训练模型在生物信息学领域的巨大潜力,为未来的研究提供了新的方向和可能性。这一模型的推广应用将极大地促进我们对细胞功能和疾病机制的理解,加速新药的开发和个性化医疗的实现。

微信扫码即可查看