
论文简介
★
★ ★ ★★空转录组技术是近年来生物信息学的重大突破之一。该技术通过同时测量大量细胞的空之间的位置和细胞中转录组的数量,弥补了单细胞测序技术难以测量单个细胞之间位置关系的缺陷,从而为理解多个细胞之间的相互作用提供了全新的数据基础。发展空之间转录组数据的基本分析方法是生物信息学领域的前沿问题之一。
提出了一种基于图卷积神经网络的空间转录组细胞聚类方法。之前对于这类数据的处理模型,大多是基于“同种细胞在空”中相互接近的假设。相比之下,CCST不依赖于局部特征,但可以从单元的全局空分布中学习节点嵌入。具体方案如下:首先将空之间的转录组建模为图结构数据。图中每个节点代表一个细胞,其原始表示是高维的基因表达信息。图的邻接矩阵是根据单元间的空距离建立的。然后分别提取图的局部特征和全局特征,以局部特征和全局特征之间的互信息最大化为目标训练图的神经网络模型,从而获得具有全局结构信息的节点嵌入。然后,对应于每个细胞的表达载体被聚类以鉴定细胞类型。最后,从生物功能的角度对聚类结果进行了深入分析。
CCST方法示意图创新ˌ革新★
★ ★ ★
在几种不同类型的数据集上,综合比较了近期学术界提出的几种相关算法。在前额叶皮层和人乳腺癌细胞的ST数据集上的实验表明,CCST在ARI、NMI和FMI上具有优势。同时,该方法得到的聚类结果具有良好的生物学可解释性。在MERFISH数据中,通过对差异表达基因和基因本体的分析,可以发现CCST聚类的每个细胞群都能很好的对应每个细胞周期阶段。
CCST与相关算法的指标比较:a .调整Rand系数;b .归一化互信息;c .福尔克斯-马洛得分;d .局部逆辛普森指数该研究为空之间转录组数据的处理提供了新的方案,具有应用于生命医学科学多层次基础问题研究的潜力,包括建模空之间基因表达的分布,分析细胞动力学,发现关键细胞亚型的相互作用及其分子机制。同时,这项研究还具有潜在的广泛的医疗应用场景。
作者信息
★
★ ★ ★★电力学院自动化系李博士为论文第一作者,电力学院教授、vilen副教授为通讯作者,助理教授、陈思恒副教授为合著者。本研究得到了国家自然科学基金和上海浦江项目的资助。
关于自然计算科学★
★ ★ ★★《自然计算科学》( Nature Computational Science)是《自然》杂志的子期刊,主要关注基础和应用计算科学,重点关注计算技术和数学模型的发展和使用,以及它们在一系列科学学科中解决复杂问题的应用。该杂志的主要目标是促进新计算技术的跨学科研究和跨学科应用。
论文链接


