◎科技日报记者张
英国《自然》杂志16日发表的结构生物学最新研究,世界著名的人工智能团队用深度思考描述了神经网络“Alpha Fold 2”。就计算机方法而言,“α折叠2”可以根据蛋白质的氨基酸序列,以前所未有的准确度预测其三维结构。

“α折叠2”可以准确预测蛋白质的结构。来源:自然网络版
蛋白质的折叠问题被认为是21世纪人类需要解决的重要科学前沿问题之一。了解蛋白质的结构有助于确定蛋白质的功能,了解各种突变的功能。
到目前为止,已经通过实验分析了大约10万种蛋白质结构,但这只是已经测序的数十亿种蛋白质中的一小部分。在过去的50年里,研究人员一直试图根据蛋白质的氨基酸序列来预测蛋白质的折叠三维结构。但是目前使用的计算方法精度有限,实验方法对人力和时间的要求也很高。
这一次,Deep Thinking首席科学家约翰·贾姆普尔(John Jampur)、创始人兼首席执行官戴密斯·哈萨比斯及其团队描述了“Alpha Fold 2”,这是一种基于神经网络的新模型,其预测的蛋白质结构可以达到原子级精度。研究团队在2020年5月至7月举行的第14届“蛋白质结构预测关键评价竞赛”中验证了该方法。

机器学习软件预测人白细胞介素-12蛋白结合受体的结构图。伊恩·海顿/UW蛋白质设计医学研究所
CASP14比赛要求参赛队伍根据其氨基酸序列分析蛋白质的结构。比赛中使用的蛋白质将首先通过实验方法进行分析,但具体结果不会公开。在竞赛中,“α折叠2”的大部分预测结构达到了空之前的精度,不仅与实验方法不相上下,而且远远优于其他分析蛋白质新结构的方法。实验方法得到的蛋白质结构叠加在“α折叠2”结构上,构成蛋白质骨架的叠加原子间的中值距离为0.96埃。排名第二的方法只能达到2.8埃的精度。
“Alpha Fold 2”的神经网络可以在几分钟内预测一个典型蛋白质和一个更大蛋白质的结构。该模型能够准确预测各种氨基酸的预测可靠性,便于研究人员使用预测结果。
研究团队认为,这种精确的预测算法可以使蛋白质的结构分析技术跟上基因组革命的发展。

蛋白质示意图。来源:视觉中国
戴密斯·哈萨比斯在一份声明中说:在CASP14会议上,他们公布了一个新的“阿尔法折叠”系统,可以准确预测蛋白质的三维结构到原子水平。他们承诺分享这种方法,并向科学界提供广泛和免费的访问。现在他们已经迈出了承诺的第一步——在《自然》杂志上分享了“阿尔法折叠”的开源代码,并发表了一套系统完整的方法论,期望看到这种方法为科学界启发其他新的研究方法。
第一代“阿尔法折叠”的问世被认为改变了结构生物学和蛋白质研究的未来:实验者将能够利用精确的结构预测来理解不透明的低温电磁数据;药物设计者还可以快速明确冠状病毒等危险病原体中每种蛋白质的结构,从而更快地开发相关药物。
编辑:王宇
审核:岳亮


