深度学习交叉下的量子计算与生物计算:基于飞桨的领先创新

核心提示当科学开始以更快的速度激荡,有一部分人先看到了未来。随着互联网的普及、传感器的泛在、大数据的涌现、电子商务的发展、在线社区的兴起,数据和知识在人类社会、物理空间、信息空间以及生命科学之间交叉融合、相互作用,量子科学、生物医药等一系列的前沿科

当科学开始以更快的速度搅动时,有些人首先看到了未来。

随着互联网的普及、传感器的无处不在、大数据的出现、电子商务的发展、网络社区的兴起,数据和知识在人类社会、物理学空、信息空、生命科学中相互交叉、相互作用。当量子科学、生物医学等一系列前沿科学。与人工智能学科交叉碰撞?

首先,量子计算给现有的信息处理方式和人工智能技术带来了新的想象空间。众所周知的经典计算机以经典位作为信息处理的基本单位,一个经典位的状态不是0就是1。相比之下,量子计算机利用量子力学中的独特现象,通过量子位来存储和处理信息。它的比特状态可以是0和1的“叠加”状态,也就是说0和1可以同时表示。如果把经典计算机和量子计算机拟人化,使它们能同时在复杂的迷宫中找到出路,那么经典计算机需要尝试一条又一条路,如果一条失败了,就再尝试下一条。虽然这个过程与容易“晕”的人类相比有很大的速度优势,但与量子计算机的“新计算”相比还是“慢”,量子计算机可以同时并行尝试多条路径,找到出口。量子计算机的特殊性质可能会为经典计算机无法有效解决的问题带来新的希望。

量子计算机在带来潜在优势的同时,要求人们具备操纵更深层微观系统的能力,这在工程上是一个巨大的挑战。近年来,国内外量子计算机的硬件都取得了很大的突破,这也使人们初步利用量子计算机解决实际问题成为可能。量子人工智能是可能产生重要突破的方向之一。作为量子计算和人工智能的交叉融合领域,这个方向可以让两个学科取长补短,实现双赢。一方面,人工智能可以利用量子计算的信息处理优势推动自身发展;另一方面,量子科学也可以利用人工智能突破研发瓶颈。总的来说,量子计算大规模应用之前还有很多棘手的科学和工程问题需要解决,而这需要以人工智能为代表的先进技术的支撑。

在这方面,国内企业凭借自身在AI技术上的优势,已经开始了RD和应用探索。去年,他们在国际量子峰会TQC 2020和QIP 2020上首次亮相,并取得了惊人的表演。其中,在TQC 2020大会中,凭借自身在量子计算领域的技术积累,成功入选邀请报告1份,贡献报告1份。这是mainland China第一份也是唯一一份邀请报告,在全球量子计算学术界的影响力已经凸显。

其实量子计算研究所早在2018年就成立了。到2020年,飞桨基于自己的开源深度学习平台,发布了“测桨”——一套支持量子神经网络构建和训练的量子机器学习工具。作为中国首个自主研发、开源、功能齐全的工业级深度学习平台,飞桨全面覆盖核心框架、基础模型库、端到端开发套件、工具组件、飞桨企业版AI开发平台。可以说为产学研创新提供了基础技术基础。

基于Flying Paddle的量子机器学习工具Measuring Paddle,搭建了人工智能与量子计算之间的桥梁,支持常用的量子电路仿真,提供组合优化、量子化学等前沿应用工具包。同时,为了方便开发者利用量子科学快速探索应用,Gauge Paddle还提供了详细的入门教程和场景案例,为广大量子计算爱好者提供了可行的学习途径。

今年1月,在量子计算峰会QIP2021上,新增了分布式量子信息处理模块LOCCNet,实现了量子纠缠处理场景的业界最佳,受到广泛关注。它还支持方便地开发核心量子信息处理方案,如量子态分辨和量子隐形传态。oar团队通过LOCCNet发现了一种新的纠缠纯化方案,这是业界最好的,可以用来推动量子通信和其他技术的发展。今年3月,测桨自适应飞桨架2.0也升级到2.0版本,运行性能最高可提升40%,达到国际领先水平。

同时在测量推进器中加入了量子噪声模块,支持开发者设置量子算法中常见的噪声。从个人发展来说适合最近的有噪声的量子器件的应用。通过飞oar深度学习平台的高能子计算,测oar为该领域的研究人员和开发者方便地开发量子人工智能应用提供了强有力的支持,也促进了人工智能和量子计算的融合与创新。

事实上,学术界早就瞄准了世界的先进方向,即学科前沿,但申请速度相对较慢。随着本世纪信息环境的巨大而深刻的变化,人类的发现、需求、创造力、知识和能力迅速得到反映和聚集,学科间的碰撞为前沿学科的技术应用带来了“加速度”,特别是最近在生物医学研究方面的突破和创新。

2020年,人类和病毒遭遇。人工智能从生物计算的角度切入生命科学,加快了生物医学研发的效率和速度。去年5月,全球首个mRNA疫苗基因序列设计算法LinearDesign上线,可用于高效设计和优化mRNA序列。从生物学的角度来看,疫苗的发展有很多方向,如DNA疫苗、mRNA疫苗、蛋白疫苗以及最常见的灭活疫苗。其中,技术成熟、效果良好的灭活疫苗的研制通常需要10年左右。这次之所以能在一年内研发出灭活疫苗,可以说是全国的奇迹,但这不是常态。相比较而言,mRNA疫苗可以省去蛋白疫苗需要体外培养抗原的环节,大大缩短生产周期,更有希望成为未来的预防工具。一旦成功,未来还会有其他类似的病毒出现,我们只需要把病毒的关键基因序列固定下来,疫苗就完成了一半。这使得疫苗的研发周期从10年左右变为以周为单位,疫苗的研发将从生化问题变为工程问题。

但mRNA疫苗的挑战在于它非常脆弱,在储存和运输过程中容易因降解而失效,导致蛋白质的表达效率大幅下降。线性设计算法针对mRNA疫苗的这一挑战进行了优化,并提出了更直接和有效的解决方案。目前,对新型冠状病毒刺突蛋白序列的计算机模拟实验也证明了LinearDesign的有效性。这种算法带来的解决方案不仅可以设计出结构最稳定的蛋白质序列,而且只需要一个半小时左右。

此外,如果进一步采用线性时间近似算法,所需时间可缩短至16分钟,与最优解的能量差距仅为0.6%。这两种设计比天然的新型冠状病毒刺突蛋白mRNA序列稳定得多。早在去年,领先的LinearDesign算法就向全球疫苗研发机构和研究中心免费开放,相关论文发表在arXiv,助力新型冠状病毒疫苗研发。

目前还与中国疾病预防控制中心病毒性疾病预防控制中心签署了战略合作协议,共同建立了“中国疾控中心应急技术中心-基因测序工作站”。此外,中国疾病预防控制中心将利用LinearDesign算法设计的mRNA疫苗序列进行体外实验,验证疫苗的稳定性和蛋白质的表达效率。2020年底,在国际顶级人工智能峰会AI Summit上,凭借新冠肺炎LinearFold和LinearDesign算法的突出贡献,爱听获得了首届“AI For Good”大奖。中国AI的技术实力、责任担当和与行业的深度融合再次赢得国际赞誉。

除了LinearDesign,在生物计算方面积累的其他成熟经验也已经基于飞桨搭建的propeller PaddleHelix进行了开源,提供了包括大规模分子预训练、药靶亲和力预测、ADMET药物性质预测等一系列算法和模型。同时,propeller PaddleHelix生物计算平台底层仍由飞桨核心框架支持,有深度开发需求的开发者也可以满足自己的需求。从上层应用场景来看,PaddleHelix满足了药物研发、疫苗设计和精准医疗三大主要场景,帮助具有生物信息学和计算机交叉学科背景的学习者、研究人员和合作伙伴更便捷地构建AI算法模型。

今年3月,凭借PaddleHelix在分子表征方面的技术创新,飞桨还登上了图形神经网络国际权威榜单OGB多项分子性质预测任务的榜首,在AI药物发现领域取得了新的技术突破。

综上所述,我们不难感受到,技术的进步使得科学研究越来越呈现出集成创新、集成发展的新趋势。跨学科融合成为当前科技发展的一大特征,而加强跨学科研究、寻求新的研究范式成为支撑科技创新取得重大突破、发展战略性新兴产业的迫切需要。

截至2020年底,飞桨已经积累了超过265万开发者,服务了10万家企业,基于飞桨平台创造了超过34万个模型。飞桨正在城市、工业、电力、通信等诸多关系国计民生的领域发挥作用。飞桨显著降低了人工智能的应用门槛,加快了创新速度,同时通过前沿学科的交叉,不断拓展创新的边界。未来,飞桨作为智能时代开源、领先、便捷、易用的基础技术的基地,也将为整个智能社会带来更多更大的可能性。

 
友情链接
鄂ICP备19019357号-22