Zhai, Yuyao2024年最新Briefings in Bioinformatics论文:scBOL:用于单细胞和空间转录组学数据的通用细胞类型鉴定框架
论论资讯 | 2024-04-29 |
108热度
Briefings in Bioinformatics
Explore content
About the journal
Publish with us
scBOL: a universal cell type identification framework for single-cell and spatial transcriptomics data
Zhai Yuyao; Chen Liang; Deng Minghua
Published:2024-03-27
DOI:10.1093/bib/bbae188
研究背景
在过去的十年里,单细胞转录组技术取得了显著进展,使得能够同时对数千个个体细胞的基因表达进行分析成为可能。细胞类型的识别在探索组织异质性和描述细胞状态差异方面起着至关重要的作用。然而,目前存在的问题是,现有的自动识别方法通常将未标记目标数据中的新型细胞类型归类为一个通用的“未指定”组,并且很难探索新型细胞类型的细粒度语义知识,从而影响模型的判别能力。此外,新兴的空间转录组技术也提出了当前细胞类型识别策略的新挑战,因为这些技术主要忽略了空间结构。因此,迫切需要开发一种多功能方法,能够有效地注释单细胞转录组数据,涵盖空间和非空间维度。
研究内容
为解决这些问题,我们提出了一项称为单细胞和空间转录组数据的通用细胞类型识别的新任务。我们的目标是为已知细胞类型的目标细胞赋予语义标签,并为新型细胞类型的细胞赋予聚类标签。为了解决这个问题,我们提出了一种名为scBOL的端到端算法,从双部原型对齐的角度出发。首先,我们确定参考数据和目标数据中的相互最近的聚类作为它们可能的共同细胞类型。在此基础上,我们挖掘循环一致的语义锚定细胞,建立两个数据之间的内在结构关联。其次,我们设计了一种邻域感知的原型学习范式,以加强数据内部的簇间可分性和簇内的紧凑性,从而激发判别性特征表示。第三,受语义感知原型学习框架的驱动,我们可以在参考数据和目标数据中对齐已知细胞类型并分离私有细胞类型。这种算法可以无缝应用于不同基础模型建模的各种数据类型,这些模型可以为细胞生成嵌入特征。具体来说,对于非空间单细胞转录组数据,我们使用自动编码器神经网络学习潜在的低维细胞表示,而对于空间单细胞转录组数据,我们应用图卷积网络联合捕获细胞的分子和空间相似性。对我们精心设计的评估基准的广泛结果表明,scBOL相对于各种最先进的细胞类型识别方法具有优越性。
研究意义
我们是第一个提出这一实用注释任务并设计了一个全面的算法框架来解决这一挑战的先驱。最后,scBOL是使用Python和Pytorch机器学习库实现的,并且可以在 https://github.com/aimeeyaoyao/scBOL 免费获取。
通过这项研究,我们展示了如何突破传统细胞类型识别的限制,为单细胞和空间转录组数据的细胞类型注释提供了一种全新的、更有效的方法。这一创新将有助于加深我们对细胞组织和功能的理解,为生物医学研究提供更准确的工具和方法。
学术热榜
查看全部
相关资讯
换一批