提速1200倍!MIT开发新一代药物研发AI,吊打老模型

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 提速1200倍!MIT开发新一代药物研发AI,吊打老模型
【新智元导读】MIT研究人员开发了一个几何深度学习模型。该模型在成功将类药物分子与蛋白质结合方面,比最快的计算分子对接模型更快、更准确,减少了药物试验失败的机会和成本。


众所周知,整个宇宙充满着无数分子。

 

这些分子中又有多少具有潜在的类似药物的特性,可用于开发挽救生命的药物呢?是百万级?还是十亿级?又或是万亿级?

 

答案是:10的60次幂。

 

如此巨大的数字,大大延缓了新药的研发进度,像新冠等快速传播的疾病,目前迟迟未有特效药,也是因为分子种类和数量太大,远远超出了现有药物设计模型可以计算的范围。

 

MIT的一个研究团队偏不信这个邪。算不过来是吧,那把之前的模型加加速总可以吧?

 

这一加速,就是1200倍。

 

他们研究了一款名为「EquiBind」的几何深度学习模型,该模型比之前最快的计算分子对接模型「QuickVina2-W」快了1200倍, 成功地将类药物分子与蛋白质结合,减少了药物试验失败的机会和成本。

 

研究论文即将发表在ICML 2022上。

 

 

初识「EquiBind」


「EquiBind」是基于其前身「EquiDock」研发的,「EquiDock」使用了已故的麻省理工学院AI研究员Octavian-Eugen Ganea开发的技术,去结合两种蛋白质。Ganea也是「EquiBind」论文的合著者。

 

在药物开发开始之前,研究人员必须找到有前途的药物样分子,这些分子可以在药物发现的过程中正确地结合或「停靠」在特定的蛋白质靶点上。

 

在与蛋白质成功对接后,结合药物(配体),可以阻止蛋白质发挥作用。如果这种情况发生在细菌的一种基本蛋白质上,它可以杀死细菌,从而保护人体。

 

然而,不论是从经济角度分析,还是从计算角度分析,药物发现的过程都可能是昂贵的,研发过程动辄耗资数十亿美元,并且在FDA最终批准之前,会进行超过十年的开发和测试。

 

更重要的是,90%的药物在人体试验后由于没有效果或副作用过多而失败。

 

所以制药公司收回这些成本的方法之一就是,提高最终成功研发药物的价格。

 

 

走进「EquiBind」


目前,寻找有希望的候选药物分子的计算过程是这样的:大多数最先进的计算模型依赖于大量的候选样本,再加上评分、排名和微调等方法,以获得配体和蛋白质之间的最佳「匹配」。

 

Hannes Stärk是MIT电子工程与计算机科学系的一年级研究生,也是这篇论文的主要作者,他把典型的「配体-蛋白质」结合方法比作「试图把钥匙放进有很多钥匙孔的锁中」。

 

 

 

典型的模型在选择最佳模型之前会花费时间对每个「拟合度」进行评分。相比之下,「EquiBind」无需事先了解蛋白质的目标口袋,只需一步就能直接预测出精确的关键位置,这被称为「盲对接」。

 

与大多数需要多次尝试才能找到配体在蛋白质中的有利位置的模型不同,「EquiBind」已经具有内置的几何推理功能,可帮助模型学习分子的潜在物理特性,并成功地进行归纳。以便在遇到新的或者无法识别的数据时成功泛化,以做出更好的预测。

 

EquiBind模型架构

 

这些发现的发布迅速引起了业内专业人士的注意,其中包括Relay Therapeutics首席数据官Pat Walters。

 

Walters建议,研究小组可以在一种现有的用于肺癌、白血病和胃肠道肿瘤的药物和蛋白质上去尝试他们的模型。尽管大多数传统的对接方法都未能成功地结合这些蛋白质上的配体,但是「EquiBind」成功了。

 

Walters说:「EquiBind为对接问题提供了一种独特的解决方案,它结合了姿态预测和结合位点识别。」

 

「并且这种方法利用了来自数千个公开的晶体结构的信息,有可能会以新的方式影响该领域。”

 

Stärk表示:「当其他所有方法都完全错误或仅有一个正确时,我们很惊讶,因为EquiBind能够把它放进正确的口袋,看到这个结果,我们是十分激动的!」

 

 

EquiBind解决的结构药物结合问题概览

 

助力「EquiBind」


尽管「EquiBind」已经收到了大量的来自业内专业人士的反馈,并且这些反馈帮助了团队考虑计算模型的实际用途,但Stärk仍希望在7月份即将举行的ICML上找到不同的观点。

 

Stärk表示:「我最期待的反馈是关于如何进一步改进该模型的建议。」

 

「我想和这些研究人员讨论,告诉他们我认为下一步可以怎么做,并鼓励他们继续前进,将模型用于他们自己的论文和方法中。目前已经有很多研究人员联系了我们,询问我们这个模型是否会对他们的问题有用。」

 

此外,这篇文章同样也是为了纪念Octavian-Eugen Gane,他为几何机器学习研究做出了至关重要的贡献,并慷慨地指导了许多学生,他是一个有着谦逊灵魂的杰出学者。

 

今年上半年,他在一次徒步旅行中永远离开了我们。

 


参考资料:

https://news.mit.edu/2022/ai-model-finds-potentially-life-saving-drug-molecules-thousand-times-faster-0712

https://arxiv.org/pdf/2202.05146.pdf


相关文章
|
18天前
|
人工智能 安全 测试技术
探索AI在软件开发中的应用:提升开发效率与质量
【10月更文挑战第31天】在快速发展的科技时代,人工智能(AI)已成为软件开发领域的重要组成部分。本文探讨了AI在代码生成、缺陷预测、自动化测试、性能优化和CI/CD中的应用,以及这些应用如何提升开发效率和产品质量。同时,文章也讨论了数据隐私、模型可解释性和技术更新等挑战。
|
16天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
73 4
|
23天前
|
人工智能 小程序
【一步步开发AI运动小程序】五、帧图像人体识别
随着AI技术的发展,阿里体育等公司推出的AI运动APP,如“乐动力”和“天天跳绳”,使云上运动会、线上健身等概念广受欢迎。本文将引导您从零开始开发一个AI运动小程序,使用“云智AI运动识别小程序插件”。文章分为四部分:初始化人体识别功能、调用人体识别功能、人体识别结果处理以及识别结果旋转矫正。下篇将继续介绍人体骨骼图绘制。
|
24天前
|
人工智能 小程序 vr&ar
AI运动小程序开发常见问题集锦二
截至当前,我们的AI运动识别小程序插件已迭代至第23个版本,广泛应用于健身、体育、体测、AR互动等场景。本文针对近期用户咨询,汇总了常见问题,帮助用户减少开发成本,提高效率。主要涵盖计时与计数模式的区别、综合排行榜生成方法、全屏模式适配及无开发能力用户的解决方案。
|
28天前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
46 4
|
8天前
|
Web App开发 人工智能 自然语言处理
WebChat:开源的网页内容增强问答 AI 助手,基于 Chrome 扩展的最佳实践开发,支持自定义 API 和本地大模型
WebChat 是一个基于 Chrome 扩展开发的 AI 助手,能够帮助用户理解和分析当前网页的内容,支持自定义 API 和本地大模型。
33 0
|
1月前
|
机器学习/深度学习 人工智能 算法
介绍一下AI在药物研发中的应用。
【10月更文挑战第16天】介绍一下AI在药物研发中的应用。
64 0
|
20天前
|
人工智能 自然语言处理 测试技术
通义千问AI来提高研发效率
【10月更文挑战第21天】
|
1月前
|
机器学习/深度学习 人工智能 算法
AI在药物研发中还有哪些应用场景呢
【10月更文挑战第16天】AI在药物研发中还有哪些应用场景呢
284 0
|
4天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗诊断中的应用及前景展望
本文旨在探讨人工智能(AI)技术在医疗诊断领域的应用现状、挑战与未来发展趋势。通过分析AI技术如何助力提高诊断准确率、缩短诊断时间以及降低医疗成本,揭示了其在现代医疗体系中的重要价值。同时,文章也指出了当前AI医疗面临的数据隐私、算法透明度等挑战,并对未来的发展方向进行了展望。
下一篇
无影云桌面