阿里云何万青:疫情后生命科学产业爆发,云计算是基础中的基础

核心提示11 月 20 日,由苏州市相城区人民政府与《麻省理工科技评论》联合主办的 EmTech China 2020 全球新兴科技峰进入第二天议程。今年,EmTech China 邀请到了数十位顶级科学家、海内外院士、商业领袖、科创精英莅临现场,

11月20日,由苏州市相城区人民政府和《麻省理工科技评论》联合主办的EmTech China 2020全球新兴科技峰会进入第二天的议程。今年,EmTech China邀请了数十位国内外顶尖科学家、院士、企业领袖、科技精英来到现场,共同探讨新兴技术的发展现状及其对人类社会的巨大影响。

会上,阿里云高性能计算总监何分享了阿里云在新冠肺炎抗疫、药物疫苗研发、跨境协作等方面提供的关键技术支持。以下为演讲实录:

大家好,今天早上起的很早,收到一条消息。今天,我的一个页面非常重要。

我今天提到的一位用户和医学科学合作伙伴获得了高性能计算行业的诺贝尔奖——戈登·贝尔奖。前两天准备这个材料的时候,是国内唯一入围的,六个入围之一。戈登·贝尔奖有什么样的背景?2012年,当天河二号连续四次登顶我们世界最强计算机第一名的时候,当时中国还拿不出申请戈登·贝尔奖的申请书。当时全世界都去找科学家和用户使用。2016年,北京大学和清华大学的联合团队获得了戈登·贝尔奖。

今天神石科技就是我今天要讲的内容之一。今天,我在这里给大家讲一个故事。你为什么派我来这里?我很幸运,在新冠肺炎期间,阿里云向全社会、全世界开放了AI免费计算能力。我们推动人工智能辅助药物筛选技术在新冠肺炎蓬勃发展。后来在3月初,我们决定全世界用科技抗击疫情的时候,我的邮箱被放在了通知上作为接口,所以我个人看到,在中国疫情爆发的短短两周内,也就是说一个月左右的时间内,当你用一项技术赶不上时间窗口的时候,我们就很难去帮助社会,但是我们阿里云很幸运的做到了这一点,我们看到了技术的力量。

回到戈登·贝尔奖,我们看到苏州有非常强大的医疗健康产业。利用这种AI来辅助药物挖掘和虚拟筛选,今天我们看到的AI计算能力依赖于成百上千倍的提升。

刚才我跑题了。我今天在第5页和第6页的时候,本来是写祝贺神石科技入围的,但是今天他们获得了戈登·贝尔奖,这是一件很棒的事情。证明HPC、AI与物理实验结合的新范式。

我今天要讲的,其实是两部分。第一部分是AI技术如何促进药物研发。

第二部分,主要是CT辅助新冠肺炎病的整体情况。

特别分享一下我刚才说的2月、3月、4月到5月的集中期。它的趋势是什么?今天,我们有幸坐在这里开会,但实际上,新冠肺炎疫情在全球的发展还不得而知,所以今天,我们讲科技的力量,医药行业和生命科学都有很大的不确定性和长期的努力。

这是我们阿里云技术抗击疫情的一个时间表。

1月21日,23、24号放假,24号左右武汉放假。21号,我们还在上班。中午的时候,突然想到给了一个很重要的合作伙伴,全球健康药物研究中心,这是比尔盖茨基因学会和中国合作的机构。我说,你会算吗?武汉的病毒DNA序列刚刚发布,计算这个病毒和SARS的区别。GHDDI用的是阿里云的资源。我们已经合作很久了。大约两个半小时后,我们得到了结果,新冠肺炎和SARS病毒的蛋白质。

但我惊讶地发现,估计传染性是三倍以上,但当时无法公布。接下来我们发现,这种企业和科学家的合作,可以促进我们尽快建立一个新的药物研发方法和数据库,用于所有的公共科研。

当时我就想,因为马上就要春节假期了,几大科学家都回家了,因为疫情隔离,没办法去办公室。后来大家看到,无论是钉钉,还是各大互联网公司提到的互联网上的新基础设施,其实都为科学家提供了最好的工具,在雪中送炭的时候提供了及时的帮助。29号,我们决定在这个小东西的带动下,向全社会开放AI免费计算能力。

当时大家都在家里,我们和各个科研老师谈,包括我们和浙大,清华,湘雅医院,钟南山医院。事实上,和钟南山团队的谈话非常感人。我们当时在家的时候,其实起得比较晚,但是他们都是八点前戴口罩,在医院跟我们视频通话。

那时,我们知道整个世界都依赖于经验丰富的科学家的大脑。但是这样一个未知的病毒怎么查呢?通过技术我们会更早看到吗?

医药行业发展到今天,其实你看一些科普书籍的话,就是医药发展史,是一个很有运气的过程。真正的广谱药,其实是用手指数的。它是从土壤中找到的,通过化学、工业化、科学产生了很多公司。这些公司实际上解决了大规模生产的问题,但要找到这种药,就要让它在毒性和浓度上与人体结合。难度很大,一般新药的研发难度很大。

在这个过程中,现在大量的生命科学计算,其中主要的研究阶段基本上是通过计算来完成的。世界各地的超级计算中心,包括中国的超级计算中心,在10大应用中,大约有4个或更多的分子动力学和量子力学的第一性原理计算。

在这个过程中,如何找到先导化合物,目标识别,这些东西都是巨大的计算量,但是接下来如何找到这种药物,合成这种药物,其实有很大的随机性和偶然性,所以会有最难的两个部分耗时最长,一个是干实验,一个是湿实验。

我们刚刚说了为什么疫苗这么难。因为这需要三个阶段的实验,一年或两年。

我们发现在支持过程中使用GPU和AI的算法越来越加速。我们抽象为生命科学计算有三类,一类是生物信息学,就是基因序列分析、比较和组合。

还是有很大的计算量。今天,为什么超级计算的计算能力在不断提高?是因为我们要模拟并充分了解一个细胞的详细情况,而用大量的细胞来计算这个量是非常困难的。戈登·贝尔奖之所以颁给深潜技术,是因为他们将一类分子动力学的计算并行性扩展到了十亿个分子级别。

这是为了解决我们现在生命科学中的一个问题。其实我们是在做目标识别和化合物筛选。其实在这个项目中,我们后来支持筛选了国内14个公立科研机构,基本都是这样组建的。

首先,第一性原理中使用了大量的计算。对于许多应用,我们发现复合蛋白的基因测序用于筛选和比较。就在美国得到武汉的序列后,第一个可能的药物给了德克萨斯大学的科学家。为什么?因为这些科学家通常很早就这样做了,他们脑子里知道什么样的化合物是有用的,但我们不能依赖一个人,人的经验和处理是有限的。所以现在经过AI和机器学习,进行大量的筛选比对,同时结合全世界的开源医学分子库。这个过程其实就是对大量知识图谱的筛选。

在这个过程中,GHDDI在阿里云上建立了一个全球开放的新冠肺炎研究平台,并研究出了八种最有效的化合物。计算方面,Remdesivir是第一,但是大家还是看到计算是对的,但是用起来不一定有用。在这个过程中,云计算发挥了非常重要的作用。

通过阿里云的全球加速服务,我们可以立即与世界各地的开源药物库联手,拉取所有海外服务网站及其数据。国内很多研究都需要这个过程,我们通过阿里云的超级计算集群提供服务。基本上都是用八个GPU卡。V100的计算能力,前几天的计算量,今天大概是4个小时,但是整体还是不够。我们知道分子尺度和尺度。我刚才就是这么说的。这个平台是春节期间上线的,和海外医疗数据库同步更新。是通过阿里的OSS同步加速发布的,主要采用了这种模式。

现在大约有100个GHDDI服务的应用程序,有十几个已经计算出结果。事实上,我们在第一时间就发现了科学家获得支持的重要性。其实回过头来看,中国是最早接触到病毒的,我们也有最早的病例。事实上,第一次支持所有这几十个大约需要三到四周的时间。一旦他们起来,他们的成果实际上被后来的研究所重用。这一阶段的工作是与病毒的赛跑。

接下来,你会想到另一个筛选的问题。在那部分,我看到收到的需求就像一个脉冲,都集中在那几周。需求邮件像雪花一样飞来,几个星期过去了,没有人申请。

当这个窗口打开的时候,你应该是熟练的,有能力的。如果你不抓住它,你就再也没有机会了。从这件小事就能看出来。

另外,我曾经做了十几年的高性能计算,做的是硬件设备,国内有很多超算系统上榜。今天我发现,在科研领域,更重要的是工业公司在做这个,它的灵活性。比如神石科技就非常智能的使用了我们的Spot实例,这是一个抢占式的实例,30%的成本支持整个大规模计算服务。这是他们的文章。今天早上,新闻报道说它获奖了。我们看到了云计算的灵活性,也就是我们在后台看到的资源量。10月份以后这部分全量上来了,因为他们做优化研究,他们想更强更拓展。哪怕只有一个分子的计算,是不是可以不断的切割成很多GPU卡,可以有效加速?这部分工作需要大量现成的资源和灵活的资源,阿里云EHPC提供了支持。

接下来第二部,第二部,我被这个故事深深打动了。三月的第一天,天马老师决定阿里云技术向全世界开放抗疫。团队说你是否愿意接收邮件。我当时犹豫了,因为还有日常工作。的确,开通后,从那天到4月29日,每天都是世界时差回复邮件,邮件源源不断。在这几个月中,数字非常清楚,大约有50个国家和地区,但起初是一些尚未出现疫情的国家,如保加利亚、立陶宛等。,就更慌了。邮件来的时候说我们的医疗设施没有办法抵御冲击。虽然我们的地盘不多,但是我们怕很快就会有一个,所以90%的人都来找我们提供阿里达摩医院做的新冠肺炎的CT影像分析。CT监测更准确,尤其是背部。治疗期间如何确定病变是普通肺炎还是新冠肺炎?我们在新冠肺炎之前做了这项工作。一般我们现在的CT监测主要依靠医生,但实际上我们可以通过卷积神经网络对结节进行分类,根据其特征标记出来进行计算。最重要的是,我可以很快做到这一点。我们支持国内的医院,他们在抗疫战场上的医院每天处理大量的CT。

当时有些医学研究生去不了学校,被紧急召回学校。为什么?要做很多的CT筛查,那时候武汉的CT会分配到湘雅医院等很多医院。读取速度很快,包括火神山。你可以看看这个数字,最快两秒就能完成。因为时间有限,我们没有再放一部电影。你可以看那个片子,除了对病灶进行检测筛选支持医生做最后的决定,还有一个就是在病灶过程中需要三维重建。这种立体的还原过程,在治疗过程中知道自己变得多大,变得多小。

无论是基本得到控制,还是有可能产生新的病灶,这个过程都很重要。下面是我们说的疫情和溯源。这部分非常重要,要和基因检测放在一起。阿里云,浙江大学和浙江疾控中心,我们筛选基因库和基因组。这部分AI是自由算力的主攻方向。

这样的话,其实一方面,不同医院、不同病例的大量样本会上云,在云上汇总,然后标记出来进行监控。另一方面,我们会将这部分共享给第三方合作伙伴,做基因测序和基因整合机。

这样,我们就可以从机器提供者那里得到没有差别和多样性的训练样本。为什么测试这么准?测试越多,越准确。它来源于云本身的互操作性和互联性。这就是我们所做的。

大家看到了五倍的速度,三个小时的监控,十一个小时的测序。

这个过程其实就是集中一段时间做这件事。

印象深刻。我们对海外开放,更多的是因为很多国家还没来得及反应。他们想了解中国的抗疫经验,除了口罩。我们有浙大医院和医院的医生要求他们通过视频和人工智能技术直接将它的中文讨论转换成英文,并与世界各地的求助者和医生进行交流。我记得我和霍普金斯医院有联系。当时我们紧急编制了防疫手册。当时我带着整个团队去感受了一下。第一,我们很慌,不知道什么时候能有进展。另一方面,因为这样做,我觉得少了一点焦虑。在这个过程中,我们看到了海外对疾病的认识,以及他们不同国家的制度和规范。其实他很多时候的反应是,他非常急切地说,我知道中国在做什么,所以我们做了很多合作平台。除了钉钉本身做平台,我们其实把视频变成了可以识别其他人的音频和语音。我记得南美,前苏联,还有东欧的一些国家,就像刚才说的,最先有集中需求,最后是印度最厉害。总的来说,作为第一个,我们会尽自己的责任。这不是技术问题,最重要的是第一云技术本身在今天起到了不可或缺的第一时间响应作用。

第二,科技的发展和责任必须在第一时间抓住它,解决它,提供价值。

今天正好是我演讲的时间。我来说说我的感受吧。我们最后的结论是,医学或者生命科学一定是我们这个时代最重要的行业,也是需求最大的行业。

第二次云计算和云计算支撑的基础设施,通过这次疫情我们可以看到,是未来蓬勃发展的最基础的基础设施。谢谢你。

 
友情链接
鄂ICP备19019357号-22