“超算”为医学研究注入灵魂

2022-08-03 12:00 来源：读者提供作者：网友发布浏览：0

核心提示【来源：健康报】生物医药产业是21世纪创新活跃、影响深远的新兴战略产业之一。但目前健康产业的供需矛盾紧张，这一点在制药产业体现尤为明显。如何更好地研究疾病机制，如何让药物研发更有针对性、更高效？现有的生化技术在某种意义上似乎走到了尽头。20

【来源:健康报】

生物医药产业是21世纪创新活跃、影响深远的新兴战略产业之一。但目前健康行业供需矛盾紧张，这在医药行业尤为明显。

如何更好的研究发病机制，如何让药物研发更有针对性和效率？现有的生化技术在某种意义上似乎已经走到了尽头。

2022年初，工信部、发改委、科技部等九部门联合发布的《医药工业发展“十四五”规划》明确提出，推动医药制造能力体系升级，用新一代信息技术赋能医药研发。“十四五”期间，探索人工智能、云计算、大数据等技术在RD领域的应用，通过对生物数据的挖掘分析和模拟计算，提高新靶点和新药的发现效率，将成为医药研发领域的重要着力点

蓬勃发展的信息技术会给生物医药行业，尤其是药物研发领域带来哪些新的突破？“超级计算机”的引入可能会为医学研究开辟一个新的范例。

药物研发进退两难

目前创新药的全球竞争几乎都集中在热点药靶点的研究上，靶点和适应症堆积如山，国内仿制药“内卷化”现象严重。

中国科学院计算技术研究所副研究员、中国科学院西部计算技术研究院常务副院长张春明表示，全球销量前100名的药品中没有“中国制造”的身影。国内创新药多集中在国外已证实的靶点和技术赛道，导致“有创新无创新”，同质化严重，这意味着新药上市时将面临残酷的价格竞争。

“人类疾病模型仍然是以模型动物为基础的。但动物疾病模型的发病机理、病理机制、疾病状态、恢复情况与真实人体有较大差异。”中国工程院院士、中国医学科学院院士丛斌曾表示，目前，人们对整体生命活动的认知还处于局部或碎片化阶段，一些新发现还处于“盲人摸象”的过程中。这是医学研发陷入困境的重要原因之一。

在疾病的形成和发展过程中，影响因素复杂，医疗实践具有不确定性，生物化学技术对人类疾病机制的探索仍然有限。以药物研发为例。一种全球创新药物从研发到投放市场至少需要14年，花费高达26亿美元。而且，效率不高。原有的以生化技术为主的技术体系难以应对，药物研发面临巨大挑战。

人工智能带来新思想

另一方面，互联网、大数据、人工智能等技术在生物医药领域的应用，为药物研发打开了一片新天地，并逐渐改变了药物研发模式。随着基因测序、检验检测设备、可穿戴设备等新方法、新工具的不断出现。，可以获得不同规模的个人健康和疾病数据。

数据可以让医生和临床研究人员从更多维度了解疾病发生发展的过程。然而，这些复杂数据的处理远远超出了个体的处理能力，迫切需要新的方法和手段来帮助药物研究人员和医生从多维、立体、整合的数据中找出规律，从而更准确地预测、预防、诊断和治疗疾病。因此，基于数据和计算方法的计算医学开始出现和发展。这也预示着未来医学发展范式的转向。

2020年，《临床肿瘤学杂志》发表了一篇文章。美国癌症协会采访了90多位癌症专家，请他们描绘未来十年癌症研究领域的蓝图。专家们提出了近百条行动建议，并在重要的一点上达成了共识:通过计算方法和数学模型检测肿瘤演变、预测耐药性，已成为推动肿瘤研究和临床诊疗的有力手段。

中科院计算所袁哲图灵达尔文实验室副主任虞照介绍，新药研发过程涉及大量数据，包括文献、化合物数据、靶标数据、专利数据、临床试验数据、真实世界数据、药物评价审批数据、上市数据等。面对海量、多源、异构的数据，人工智能技术的应用已经逐渐跳出传统的基于理想生物模型和临床表型数据的新药研发模式，转向以数据和数字孪生为核心的研发模式。

比如在靶点发现和机制研究方面，可以通过数字双生子数据库发现药物与疾病的关系，发现新的靶点；在化合物筛选方面，虚拟筛选技术可以替代传统的活性筛选；在临床试验设计中，试验过程管理、数据统计分析、研究设计等一系列过程。也可以通过全过程模拟完成，试错过程可以在计算机上完成，提高整个临床试验的效率。

目前，全球在寻找“正确的”药物分子方面取得了很大进展，超过1000家公司一直在探索“AI”分子。“AI﹢病”的研究虽然刚刚起步，但却直指药物研发的核心痛点——发病机制和靶点。

医学研究从“超算”开始

临床数据和先验知识只是初步的“原材料”，而算法和计算能力则为医学研究“注入灵魂”。

中国科学院计算技术研究所从事生物医学研究已近30年。近年来，基于“超级计算”的相关研究成果，该院高性能计算机研究中心团队从“计算医学”的角度为医学生物学的研究带来了新的视角。

计算的概念早在20世纪80年代就已经提出，计算技术在医学领域应用的相关研究也陆续展开。1994年，在美国奥斯汀举行的第一届计算医学、公共卫生和生物技术会议上，计算医学已经崭露头角，成为医学的一个重要前沿研究方向。2012年，美国约翰·霍普金斯大学生物医学工程教授雷蒙德·温斯洛(Raymond Winslow)在一篇题为《计算医学:从模型到临床》的综合文章中指出，计算医学已经从理论走向实践。

2020年，中科院高性能计算团队重新定义了计算医学的内涵。计算表现在四个维度:以系统论为指导思想；采用密集数据驱动作为科研范式；以人工智能为手段；由高性能计算支持。通过第三代人工智能“知识模型”和“数据模型”的双重驱动，为生命科学研究提供了新的技术体系和新的研究范式。

计算医学以复杂系统科学的整体性理论为思维模式，进而理解生物分子、细胞、组织器官、人群等生物层面相互作用中出现的新属性，从系统的角度捕捉疾病的发生机制。计算医学以密集数据驱动的科学范式，专注于挖掘隐藏在高维、高通量、多维生物医学大数据中的新见解。

计算可以将生物医学领域的知识模型转化为数学模型，以生物医学大数据为输入参数，用人工智能算法迭代训练模型，输出接近现实的生命系统的结构和功能特征，从而理解疾病发生的本质。同时，基于高性能计算，为新的科学发现提供数据存储、计算精度和计算速度支持。

以张春明的药物研发为例，说明了计算医学的前景。在传统的药物研发路径中，跟随商业化趋势，通过大量实验进行研发，不仅周期长、成本高，而且成功率相对较低，实现规模化研发相对困难。但引入计算医学后，药物研发的差异化创新能力增强，整个模拟研发过程只需2周左右，结果可预测。通过计算，完成了大量的试错，减少了很多无意义的实验。同时，通过系统识别疾病和目标，提高了规模能力。

新的视角仍有待探索。

近年来，随着数据的快速积累和大数据处理与挖掘方法的成熟，深度学习、自然语言处理、知识图谱等人工智能方法在分子合成、医学图像识别、病历信息化等领域取得了令人瞩目的成就。这些应用场景和技术领域的创新也推动计算医学进入快速发展期。

接下来，在第三代人工智能“数据-知识”的双重驱动下，通过建立生命的数字双胞胎，计算医学更加贴近生命功能的核心认知。

“机器学习是一种全新的认知方法论，人类无法真正理解，但可以被实践检验。我们是相信‘实践是检验真理的标准’，人机互补共建命运共同体，还是坚持机器必须告诉人演绎和归纳才是真理，人类将面临新的选择。”中国工程院院士李国杰曾表示，要让机器学习在生物医学领域发挥更大作用，应该在基础研究方面多下功夫。

张春明承认，传统的生物信息学也面临着不可避免的“门槛”，“维度诅咒”就是其中之一。这些数据带来了数千种可以检测到的潜在生物标志物。传统的生物信息学工具和分析方法无法利用日益增加和多样化的数据寻找生物标志物，上述方法筛选出的生物标志物只能在小范围内代表患者的特征，无法在前瞻性临床试验中得到验证。在这种情况下，如何充分利用海量信息，然后形成可衡量的指标就变得非常重要。

如果你把计算能力比作一架飞机，一架载有生物医学数据的飞机，你必须有一个既了解飞机又了解负载的深度跨团队来担任飞行员。然而，在生物医学和超算并行优化技术方面有深厚造诣的团队在世界范围内极其稀缺。

虞照表示，随着生物技术与信息技术的深度融合、数据成本的不断降低和行业认知的不断深入，计算医学将为新药研发、疾病诊断新工具和新疗法的诞生提供可能。随着这一新技术体系的不断自我迭代和“数字双胞胎”的建立，个性化医疗将走进现实，这将为医学研究和生物医药产业的发展引入新的范式。