在科学面临历史性机遇的今天,人工智能与传统科学研究相结合所带来的巨大潜力,使得“AI for Science”成为当前的重要趋势。近日,未来论坛科学讲座《理解未来》聚焦“AI+生命科学”,来自人工智能、计算机和蛋白质的结构预测、分子力学等生命科学领域的科学家畅谈前沿科学突破。本次讲座由未来论坛主任、北京大学李兆基讲座教授谢晓亮策划。
中国工程院院士、鹏城实验室主任、北京大学博雅讲座教授高文分享了云脑二号:科学智能计算的AI、鹏城扁鹊模型等最新科研成果。高文介绍,要让AI服务于科学问题,首先要搭建一个先进、独立的云智能计算平台,支持大规模开源、开放、模型共享。他指出,鹏程云脑二号已建成国内首个自主E级AI计算平台,形成了自主AI基础软件栈、AI算法流水线、高性能并行计算等一系列支撑架构。云的超大规模模型训练平台已赋能全球首个2000亿参数中文预训练语言模型——彭城盘古、多对多多模式多语种机器翻译模型——彭城丝路、视觉与跨模态模型——彭城盛达,并联合开发了增强知识模型——彭城文心等引擎。

在AI赋能的生命健康领域,鹏程实验室正在建设的鹏程扁鹊模型,依托鹏程云脑设备,构建跨基因和表型的多模态知识图谱、预训练模型和高精度生理生化仿真模型,通过数据感知和人类基因组大数据的融合分析建模,最终服务于生命健康领域的基础研究,促进健康医疗。

美国芝加哥丰田计算技术研究所教授、北京大学客座教授徐金波分享了利用人工智能颠覆蛋白质结构预测、改变分子生物学研究范式的突破。
徐金波介绍,2016年,其团队开发的深度卷积残数网络大大提高了残数或原子相互作用预测的精度。随后在2020年,谷歌旗下的人工智能公司DeepMind开发了一种基于注意力机制的神经网络。
“通过使用人工智能,我们颠覆了蛋白质的结构预测,甚至改变了许多分子生物学家的研究范式。很多人开始用预测的结构来分析蛋白质功能。”徐金波还指出,目前该领域还存在一些未解决的问题,比如当一个家庭中只有一个孤儿蛋白时,是否存在蛋白复合物。现有方法的精度并不理想。“我们希望精确预测蛋白质在一定条件下的结构,与肽和核酸的相互作用,以及突变对蛋白质结构和功能的影响。”
此外,在前瞻对话环节,高文指出,AI在未来十年的生命科学发展中将大有用武之地。比如:人类对基因组学的分析,哪些片段有什么功能?哪些片段有哪些突变,会对人体健康产生怎样的影响?只要获得足够的数据,就可以通过AI进行计算分析,给出药物和饮食方面的建议,从而降低或延缓人类的发病率,提高人们的生活质量。
高还表示,人工智能还将在小分子药物设计领域发挥关键作用。过去,大多数药物成分都是从大自然中提取的,而随着AI的赋能,可以高效地确定蛋白质的结构和功能。我们可以针对某些蛋白质对症治疗,通过生成或设计蛋白质结构来制造药物。预计通过AI算法和数据模型的不断进化,该领域将在十年内实现突破。
谈及AI+生命科学的产业化应用价值,徐金波表示,目前“AI for Science”的产业化环境非常好,尤其是“AI for Biotechnology”。国家非常重视“AI for BioTech”领域,投资机构也支持硬技术的早期和长期投资。从产业的角度来看,由于AI赋能了生物制药领域的各个环节,帮助行业提高效率和精度,因此AI在该领域的产业化也有很好的前景。


