编辑推荐:
龙讯匡腾联合腾讯量子实验室、腾讯云、石林教授,对超大体系材料进行第一性原理计算联合研究,利用龙讯匡腾创新的线性尺度三维分块算法和腾讯云高性能GPU计算产品优势,首次成功实现百万原子平面波精度的第一性原理计算。

以下文章来自腾讯量子实验室,由量子姐姐撰写。
摘要
近日,腾讯量子实验室、腾讯云高性能计算产品团队、北京龙讯旷腾科技有限公司、盐城工学院石林教授联合攻关,成功实现了百万亿级硅原子系统平面波精度的第一性原理计算。该工作由腾讯量子实验室牵头,基于龙讯旷腾公司的线性尺度3D分块算法和腾讯云的高性能计算集群产品。后续腾讯量子实验室和龙讯旷腾公司将进一步深度合作,持续探索超大系统平面波精度第一性原理计算的商业化场景,帮助高校和企业科研团队解决材料科学研究中的重要难点问题。
01工作总结
第一性原理计算是研究材料物理化学性质的重要手段,对新材料的开发具有重要意义。通常情况下,新材料从发现到大规模应用需要很长的RD周期,需要巨大的资金投入。以半导体材料硅为例。硅在19世纪50年代首次被提纯,但直到20世纪50年代,硅才被用于晶体管,并逐渐商业化。第一性原理计算是基于量子理论的基本原理,结合高性能计算系统强大的计算能力,通过数值迭代法求解物质系统的偏微分方程,从而获得物质的物理或化学性质。第一性原理计算为理解材料的性质、预测其在不同环境中的行为、指导新材料的发现和设计提供了更快的途径,有望大大降低新材料的研发周期和成本。
基于密度泛函理论的第一性原理计算,算法复杂度较高),其计算时间随着原子体系的膨胀呈三次多项式级增长。此外,由于计算机的浮点运算能力、内存/显存大小、内存空与并行计算机之间的通信延迟等因素,第一性原理计算所能模拟的物质体系规模通常局限于数百个原子。以应用最广泛的平面波精度第一性原理计算软件VASP为例,直接计算明星材料魔角石墨烯的电子性质几乎是不可能的。即使使用顶级的GPU计算资源,并行计算环境再完善,也会因计算效率低下而大大降低实用价值。而量子结构和量子器件的研究通常需要10万甚至100万的原子计算能力,目前的模拟计算能力远远不够。
为了解决计算时间复杂度高的问题,科学界提出了一系列线性标度的第一性原理计算方法,计算复杂度可降为O或O)。本工作使用的LS3DF软件,在线性尺度三维分块算法的基础上,巧妙的引入了基于分治并行的通用思想的误差抵消策略,来处理分治区域边界引起的误差。与其他计算方法相比,该方法原本的优势在于可以将计算的时间复杂度降低到线性复杂度,同时保证计算的平面波级别精度和应用场景的普适性。基于腾讯云黑石高性能计算集群产品,量子实验室研究人员通过黑石物理服务器的极致计算能力和高速低时延的RDMA网络互联,解决了LS3DF软件编译优化、I/O存储优化、大规模GPU通信等问题,为LS3DF软件构建了稳定可靠的专有计算能力基础。通过各方的紧密合作,项目组最终实现了基于240块V100 GPU卡的超大规模GPU并行计算,在16小时内完成了112万个硅原子的电荷密度计算。首次在平面波精度的前提下,实现了百万原子超大体系的第一性原理计算。
其他可以实现超大物质体系计算的方法包括:用原子轨道基组代替平面波基组;采用无轨道密度泛函理论方法。但这两种方法通常都达不到平面波精度,其中有些方法有一定的适用条件。例如,在计算原子力时,原子轨道基组往往存在基组重叠引起的误差,这种误差很难消除。但轨道密度泛函方法目前只能用于轻原子金属,应用范围有限。相比较而言,LS3DF算法是通用的,可以在从半导体到金属的不同体系中使用,没有这些限制,可以达到直接平面波计算的精度。表1总结了近十年来基于上述方法的超大规模物质系统第一性原理计算的相关工作。
表1:超大规模材料体系的第一性原理计算在现实世界中,一百万个原子系统相当于一个10纳米见方的纳米粒子。随着这项工作的完成,量子的高精度模拟从微观尺度提升到了介观尺度,开拓了我们对量子第一性原理计算的想象空,可以应用到微电子晶体管等一系列问题。腾讯量子实验室和龙讯旷腾公司将继续探索超大系统平面波精度第一性原理计算的应用场景,并基于腾讯云和腾讯材料研究平台提供相关科研服务,帮助高校和企业科研团队解决材料科学研究中的重点难点问题。

02算法与实现
线性三维分块算法由龙讯旷腾首席科学家王博士开发。本文所用的LS3DF软件是在王博士的LS3DF开源软件基础上进一步开发的。
本次计算使用了30台基于腾讯云GPU的HCCG5v服务器。相同的计算资源分别用于10,000、100,000和500,000个硅原子的自洽计算。自洽计算时间随原子数的变化趋势如图1所示。可以看出,LS3DF算法在获得与常规第一性原理方法相同的计算精度和准确度的前提下,可以达到O级的计算复杂度,这将大大降低计算资源的消耗,使平面波准确度的第一性原理计算在超大规模系统中成为可能。
图1:硅自洽计算时间随原子数目的变化趋势10,000个硅原子在不同数量的HCCG5v服务器上的计算时间比较如图2所示。这一结果显示了LS3DF算法优异的并行加速比。令人惊讶的是,10000个硅原子可以在一台HCCG5v服务器上轻松计算出来。这充分证明了LS3DF算法具有极高的并行可扩展性,在同类算法中优势明显。
图2:硅自洽计算时间随服务器数量的变化趋势通过这种计算获得的系统电荷分布如图3所示。通过这种计算,可以详细分析超大规模体系中每个原子周围的电荷分布和电子性质,可以满足未来各种量子器件研发的需要。
图3:1万/10万/50万/100万硅原子体系的电荷分布03团队介绍
腾讯量子实验室
腾讯量子实验室是腾讯在量子计算领域的前瞻性布局。该项目由香港中文大学量子计算科学家张晟昱教授于2018年领导。腾讯量子实验室作为腾讯前沿科技实验室矩阵成员,旨在研究量子计算系统、量子计算和量子系统仿真的算法和基础理论,及其在相关应用领域和行业的应用。在实验室开发新的量子组合算法和量子AI算法,分析其在信息处理、新药研发和材料设计中的应用。在实验室研发腾讯云上的材料研究平台和药物发现平台,在材料、制药、能源、化工等相关领域建立生态系统。同时,实验室持续关注和研究全栈量子计算机系统。目前,腾讯量子实验室拥有来自国内外顶尖高校的跨学科团队,具备从物理、计算机、电子、化学、生物医药、材料等基础和应用研究到定制化平台开发的端到端交付能力。
龙讯矿腾公司

北京龙讯旷腾科技有限公司成立于2015年,是国内材料计算仿真工具软件研发的领导者。其愿景是开发符合“工业4.0”要求的原子精密材料研发Q-CAD软件。龙讯旷腾公司集成了优化算法、人工智能、高性能计算等先进技术。,其人员在材料领域拥有数十年的经验,为材料Q-CAD软件的开发奠定了良好的基础。目前,公司拥有完全自主知识产权的国产第一原理材料计算软件PWmat,在求解算法、异构加速、大规模并行优化等方面具有国际领先地位,在保证计算精度的同时,可大幅提升计算规模和效率。该公司的线性缩放算法可以计算数百万个原子,并拥有60多个材料属性计算模块。我们的产品可以将基于量子力学的原子级计算应用于新材料的设计、加工、优化等一系列RD和生产环节,将为微电子、化工、新能源、生物医药等行业的发展带来革命性的创新驱动力。
腾讯云高性能计算产品团队
腾讯云高性能计算产品团队以服务行业创新升级和企业智能化转型为目标,致力于为客户打造触手可及的顶尖计算服务。基于高性能计算集群HCC和高性能计算平台THPC等产品,团队构建了性能优越、易于使用的计算基础,释放了云的极致效率。目前已为科学计算、天气预报、CFD/CAE、基因测序、AI训练等多场景客户提供计算支持,打造云上超算新体验。未来,腾讯云高性能计算产品团队将继续服务客户,构建高性能计算生态,助力科研和产业突破,通过产品创新,让云上的HPC成为社会发展的水和电。
石林研究团队
石林研究团队实现了半导体材料中点缺陷电声耦合系数的第一性原理计算,开展了局域声子、无辐射复合、发光效率和寿命的理论计算和测试分析,具有丰富的大规模体系平面波计算经验。


