云栖号案例库:【点击查看更多上云案例】
不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策!
新型冠状病毒的爆发,猛然将全国医疗机构拽进了一场与病毒赛跑的战役当中。病毒传播速度骇人,用药需求迫切。各医药研究机构都想方设法利用最先进的技术,最大化缩短研发周期,加速有效药物投入使用。
以计算驱动创新的药物研发科技企业晶泰科技也于1月20日迅速成立研究小组,调集云端算力,对病毒感染宿主机理提供分子层面的研究,建立病毒关键蛋白与人体配体结合区域的三维模型,预测病毒可能出现的强传染力突变,还从已上市药物中筛选可能具有抗新冠病毒活性的药物,并将大量计算数据、模型与成果公开与同行分享,为疾病防治及药物研发提供支持。
最新的好消息是,抗疟疾药磷酸氯喹可能成为新冠肺炎的破局之药。该药物在临床试验中被证实对新型冠状病毒肺炎(COVID-19)具有良好的治疗效果,但其治疗机理和分子机制尚不清晰。晶泰科技对氯喹可能的作用机制进行分子动力学模拟,验证了该药物对病毒的一种作用机制,并发现其新的潜在治疗机理,为抗疫药品开发与优化提供研究基础与科学参考。目前,晶泰科技正与众生药业合作,推进体外实验验证。
在本次抗冠药物研发中,阿里云在晶泰科技背后提供了大量的免费算力支持。每一次的分子动力学模拟背后,都离不开高性能计算。
阿里云免费开放算力,加速新冠药物研发
高性能计算(High Performance Computing,简称HPC),常被称为“超算”,是当代虚拟药物研发的重要支撑。以老药新用为例。从已有的药物里面,找到能治疗新冠的药是最快的方式。若研制新药,则会涉及到后续的大量临床实验和药监局审批,远水救不了近火。
要找到阻碍病毒的正常活动的化合物,以往的方法是通过大量实验做筛选,费时又费力。如今,科学家尝试通过机器模拟分子化合物与靶点的相互作用,从而筛选出可能有效的化合物做实验,从而扩大搜索范围,提高筛选针对性,节约研发时间,将有限的实验资源应用到最有可能成功的候选药物上。
首先要了解靶点与化合物作用的意义,如能找到干扰病毒复制的化合物(药物),就能抑制病毒对机体的伤害。比如,病毒蛋白在合成过程中,需要蛋白酶的介入,如3CLpro蛋白酶和PLpro蛋白酶,抑制蛋白酶的功能就是抑制病毒的方法之一。
病毒体内能够被其它物质识别或结合的结构,被称为靶点(Biological Target)。如果找到能够与这个靶点结合的小分子药物,就能阻碍蛋白酶水解酶前体多聚蛋白,无法释放病毒RNA复制所需的聚合酶与解螺旋酶,进而改变其功能,阻碍病毒蛋白合成,导致病毒无法复制,实现抑制病毒复制的效果。
晶泰科技通过药物模拟算法,从2900个已批准上市药物与10000个中药分子中找到183个有潜在抑制新冠病毒3CLpro和PLpro靶点的药物,又经过高精度筛选,用分子动力学方法精确模拟计算药物化合物与病毒靶点间的亲和力,将这一列表缩小到38个药物,这一系列预测需要完成大量高精度的计算。
如此级别的高精度计算,所需要耗费的计算资源超乎想象。若用一台电脑(1张GPU卡),一天只能完成8-10个分子的计算模拟,至少几十天才能完成一次筛选。晶泰科技在云计算的帮助下,将这一过程从一个多月缩短到了一周,从而节约了宝贵的研发时间,将药物体外实验的进程大大提前。于此可见大算力的重要性,云端高性能计算为能相关场景提供大规模算力。
疫情的肆虐使得算力供不应求,为了抗击疫情,1月29日,阿里云宣布向全球公共科研机构免费开放高性能计算平台、CPU/GPU集群及AI算力。阿里云陆续支持了超过10家一线抗疫科研机构,涵盖了药物研发、CT医学图像AI诊断等抗疫一线急需解决的问题,晶泰科技亦是其中一家获支持机构。
研究氯喹的作用前,晶泰科技就利用云计算完成了部分研究:从分子层面理解病毒感染机理,判定出未来同类病毒的人际传播风险;通过高精度计算,预测病毒及其突变对传染性和致病性的影响;获得阿里云高性能计算平台提供的公益算力后,晶泰科技北京人工智能药物研发中心很快完成针对全球已上市药物小分子及中药分子的老药新用筛选,目前正在进行实验验证,并继续支持广谱抗冠状病毒新药的研究。
利用自动伸缩,节省成本与运维工作量
晶泰科技在本次疫情中与阿里云合作流畅,推进迅速,得益于此前持续合作建立的基础。
晶泰科技从成立伊始就对云情有独钟,源于其在药物发现、开发中用量子物理、人工智能对药物关键性质进行模拟的商业场景,对高性能计算算力的需求有时间不定期、规模不定量的特点。若购买了固定的算力,波谷时期意味着企业成本浪费;而在疫情这般非常时期,药物研究是一场与时间的赛跑,固定算力的天花板也会限制科学家的研究效率。云超算的弹性与此不谋而合。
去年春天,晶泰科技已开始对阿里云超算平台进行测试使用,它可以根据自身需求随用随买,不过晶泰科技时大时小的算力需求,若人肉运维依然繁琐。为此,阿里云超算的技术人员开发了基于HPC作业负载的自动伸缩服务,可根据集群调度器中作业负载情况,自行帮助晶泰科技进行计算节点的申请和释放,调整硬件计算资源,帮助用户优化资源成本。
比如,当集群中没有排队作业,但仍有空闲节点时,自动伸缩将会放空闲节点,从而降低节点空置率。反之则根据调度器中排队作业的资源需求,按预先设定的策略自动扩容。为了加快扩容时的软件部署,阿里云超算还上线自定义镜像功能,将扩容时间压缩到1分钟左右。
跨机房调度算力,缩短药物研发时间
高度波动的算力需求,也给库存与机型的调度带来挑战。
一般情况下,高性能计算集群节点都位于同一数据中心内,而晶泰科技的研究,经常需要建立大规模的GPU集群,其GPU需求量一旦触及波峰,时而面临单个数据中心无法满足的情况,这限制了其药物研发时间。
于是,阿里云超算团队的工程师实现了基础设施的互通,为晶泰科技设计了跨数据中心的资源调度方案,实现快速响应晶泰科技的机型供给需求,即使在算力紧张时也能帮助科学家大大缩短计算时间,加快药物研究。
优化软件环境,提高运算性能
在生物制药行业,Gromacs是分子动力学模拟(Molecular Dynamic Simulation)常用到的开源软件,在本次新冠病毒研究中,自然是必不可少的利器。
阿里云超算平台早先便对Gromacs做了集成,提供多节点并行和GPU加速等多个软件版本,用户只需通过简单的勾选操作,就可以轻松完成Gromacs在云超算集群上的快速部署。阿里云还可以根据客户Gromacs软件的使用情况,通过针对性的软件调优,来进一步加速分子动力学模拟计算过程。从软件底层数学库、多节点并行通讯库,进程/线程配比及计算任务分配等多个角度进行调优,阿里云超算团队可以通过有效加速Gromacs软件计算过程,实现20%的性能提升。
目前,阿里云正与晶泰科技进行沟通,确定在指定算例上分别加速Gromacs CPU版本和GPU版本的性能调优目标,在下一阶段的药物研究中进一步为其加速。此外,晶泰科技还应用了容器Docker技术,将晶泰科技内部的软件和算法包装到docker里面,一般的高性能计算很少使用。阿里云超算则配备了高性能容器应用服务,晶泰科技只需要打包好需要容器应用,上传到阿里云容器镜像库里,即可就轻松直接部署在集群中,节省了相关环境改造工作。
新冠疫情仍未过去,跟病毒的战争仍在继续。如今,晶泰科技正加速推进体外实验验证,阿里云的工程师们正连轴转支持着各医疗机构的药物研发,可喜的是,阶段性进展次第公布,相信未来能听到更多的好消息。
【云栖号在线课堂】每天都有产品技术专家分享!
在线课堂地址:https://yqh.aliyun.com/live立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK