生命科学和智能计算峰会 -AI + 分子模拟,赋能药物发现新源头(二)
嘉宾信息:
张林峰 深势科技创始人&首席科学家 北京科学智能研究院研究员
AI + 分子模拟,赋能药物发现新源头(二)
六、Uni-Fold+Rid赋能无结构靶标结构预测与解析
在这里面是我们很能关心的点,尽管整体来说,从这个ai模型预测得到结果已经相当不错,但是一些局部可能还不够,需要我们结合这个模拟的手段来进步模拟。在这其实遇到的问题变化往往是需要这个很长的时间来克服变化的,这里面我就发展了一个所谓的方法,其实是用神经网络去表示这个高维的几合变量所对应的能力自由来加速的。所以,在这样的一个方案的基础职场,结合我们最开始的一个ai的预测,可以进步的对蛋白的进行得到一个更好的结构。
七、Rid辅助寻找别构位点
结构的例子是我们对于一些可能更有价值,这个设计的需求所给出的例子来说,是会发现很多的体系,在考虑要设计的时候,是需要考虑这个的,我会发现这个构象,往往是一个模型预测给我们的。紧接着我们需要一个增量来去帮助我们发现一个构的点,这样的一个例子里面,我们会发现,这个构的位点是一个在左角的这样一个点,而传统的这样一个直接的模拟的手段,由于这里面白非常的高,所以事实上我们的这个在比如说50个模拟的时间里面,大部分时候,这可能卡在这样的一个正点下的,但是结合增强采样的辅度增样的方法,我们会很快的,大范围的采集到这样的一个体系的位置上,在我们的研发的案例中,也是在这样的一个情形之下,我们发现有一个体系,有一个结合的药物,往往比较差。
八、Uni-EM冷冻电镜结构解析
其实对于那样的一个,我们找到了一个比较合适位点针对别位点所进行的一个非架的药物设计,这个数据结构预测以及进步的增加采的观理,以及可能关于这个电竞的一个奖项,除了模型的结合之外,我们发现很多时候跟这个模拟的手段相结合非常的关键,比如在这里面,当我们对于我们最后确定一个蛋白体系的结构来说,就是一个电子点的,这样之下,结合这个模拟所达到的效果,是我们的一个体系能够很好的一个任务。我们会发现,比如说一个直接的结构预测试,一个结构确定,这样的加上实验的数据,最终得到的这样的一个能够带给我们一个最理想的结构。
九、Uni-Docking
这时我们带来的一个确定结构的时候,就会需要大规模的虚拟筛选,而虚拟筛选其实当我们考虑方案的时候,也是觉得蛮尴尬的,这样的一个方案其实在很长的时间里面,基本上都是一个被利用的非常多,但基本上都是十几年前一个的版本。
很自然的,在我们的高性能计算的一个背景之下,我们需要对它进行及时的优化优化,就是把所有的部分都搬到到gpu上,利用gpu的一个它自身的特点,对于这样一个场景,我们可以进行进一步的调整,比如说的这样一个探索的参数更大一点,然后局的可能会更加行一些。
经过这样一系列的针对gpu特点的一个优化,我们得到了一个性能的很大的提升,就是相于个cpu,但这是一个一个比较,成本是不一样的,从成本上的差距要这个远低于我们性能上带来的提升,因为这个相比性能上提升了,在同样的精度限下提升了1000多倍,这样的一个能上的提升,再加一个弹性算利的供给,其实让我们在通过并行调度100卡,100张这个的这样一个基础之上,能够完成十多个小分子的工作效率,这使得我们大规模的这个筛选这个能力得到了更大幅度的提升。
其实我们发现,比如说对于脑屏障这疾病来说,因为这个障限制其实是需要分子是比较小的,而对这样一些特定的疾病类型,我发现这个对应的这个分子的可能性已经不再需要我们的尝试,基本上可以去做这样的筛选,这个算例的算法的结合带给我们的新的可能,当我们筛选完,大部分筛选确定基本有活性的物经过一确认的时候,经过一些这个性确认的时候,下一个需求,就是对这个药物进行进一步的打造,以使得他符合一系列的性质,优化的需求。
所以,往往在这种情况下,我们是已经有了一个有活性药物,然后想要对它进行改造,这样的改造往往是最基础的,有些时候需要一些国家这样的一个调整,能够使得这个药物相应的化学性质得到的性变化太低,这样一个决方案实就是能够给我们在这个药物变化前后的一个合的改变的一个定量的计算。
目前其实已经能够达到在很大的范围内达到一个这样一个标准,所以能够在这个环节上大大的这个降低设计完合成分子所对应的这个实验的实验的成本和时间成本,在这样的一个环境之下,也是在这个阿里云的一个支持之下,我们已经有相当多的客户在使用这样解决方案。
在这个合成分子前,在优化的设计之前,用更大规模的app的计算,对活性下降的比较厉害的分子进行筛选,排除合成能够搜索范围和对应的最后的分子的质量,得到了更高的,更大的提升。
十、All in One:面向未来的药物计算设计平台
刚才这个例子,是在这个药物研发的各个环节上,从最开始的结构的确定,以我的实验数据,或者没有时间实现数据的到进一步的把点的发现是可以直接有确定的,或者说用变购的一些通过东西模拟确定的。
再进一步,这个药物的筛选和优化等各个环节上,我会发现目前其实已经形成了一套的计算的方案,而这样一个计算方案,其实往往在随着我们跟应用的一方面,随着应用场景的深入,会发现非常多的复杂的场景。比如说app,分子a和分子b它的变化,它的调整,其实它对应的情况非常的多,这样的一个场景的复杂度,是得我们在这个解决方案的一个最后的一个工业化的程度上,提到有了新的要求。
与此同时,我们基础快速的变化,我们底层的能够拿到的,以及相应的性能特点,以及我们是否选择性能优化,是否选择在一个大规模的这样一个需求之下,也会变得是一个技术的追求,变成一个成本上非常重要的考虑,所以在这样的一个解决方展进的过程中,我们也是在这一层,算力整个因素这一层,以及我们的场景对应一系列的合作伙伴和客户不同的成长,然后方案是我们在研发方面也形成了一个称之为五环的样子,其实是从这个结构到动力学,到这个药物的发现,到这个国家是非常的有逻辑,非常简单的,一种加一种国应的一系列,形成其实是需要很大的工作量。