Science:深度学习建模,AI巧手设计特定蛋白质

简介: Science:深度学习建模,AI巧手设计特定蛋白质



 新智元报道  

编辑:Joey 如願

【新智元导读】蛋白质设计最近风头正盛,这不又来了新作品,华盛顿大学的研究人员开发了两种深度学习算法可预设计特定功能的蛋白质。


蛋白质是构成生命的基石,而如何快速、准确地确定蛋白质的三维空间结构,在生命科学领域一直是个难题。

 

复杂的蛋白质结构 图源:science


而现在研究人员利用全蛋白质组氨基酸协同进化分析和基于深度学习的结构建模,可完成对蛋白质结构的系统性预测。

 

 

随后,来自华盛顿大学生物化学系的Jue Wang等人提出了两种深度学习方法来设计「预设定功能位点的蛋白质」,并将其成果发表在Science上。

 

论文链接:https://www.science.org/doi/10.1126/science.abn2100

 

首先,他们发现了可折叠成包含功能位点的蛋白质序列。

 

然后,他们重新训练了一个结构预测网络,从而在只确定功能位点的情况下恢复蛋白质的序列和完整结构。

 

第一种方法叫Constrained hallucination,通过在序列空间中进行梯度下降以优化损失函数,并辅以特定问题的交互项,以设计候选免疫原呈现被中和抗体识别的表位,用于抗逃逸病毒抑制的受体陷阱,金属蛋白和酶,以及具有围绕已知结合基序扩展的设计界面的靶结合蛋白。

 

第二种Missing information recovery中,从所需的功能位点开始,共同填充蛋白质所需的缺失序列和结构信息,并通过经过更新的RoseTTAFold训练以从结构中恢复序列。

 

AlphaFold2 结构预测计算表明,这些方法可以准确地生成包含非常广泛的功能位点的蛋白质。


潜在诺奖候选人、蛋白质设计师

 

提到蛋白质设计,不能不提到大名鼎鼎的蛋白质设计师——David Baker。

 

他是华盛顿大学生物化学教授和霍华德休斯医学研究所的研究员,IPD 所长和首席研究员。

 

作为蛋白质设计和结构研究的领头人,这几年来一直被认为是诺奖的有力竞争者。

 

 

2020年11月30日,由 DeepMind公司开发的人工智能程序AlphaFold2,在蛋白质结构预测大赛CASP14中,对大部分蛋白质结构的预测与真实结构只差一个原子的宽度,达到了人类利用冷冻申镜等复杂仪器观察预测的水平,这是蛋白质结构预测史无前例的与大进步。

 

随后,David Baker 教授带领的研究人员,研发出了一款完全免费的RoseTTAFold,不仅拥有媲美AlphaFold2的蛋白质结构预测超高准确度,而且更快、所需计算机处理能力更低,

 

现在,David Baker教授带领的研究团队,进一步将AlphaFold2与RoseTTAFold相结合,成功用干蛋白质-蛋白质复合物结构的预测。

 

Baker表示,「在蛋白质设计研究所这忙碌的一年中,我们设计COVID-19疗法和疫苗并将其投入临床试验,同时开发出用于高精度蛋白质结构预测的RoseTTAFold工具。我很高兴科学界已经在使用 RoseTTAFold 服务器来解决突出的生物学问题」。

 

梦想和现实

 

OpenAI使用神经网络,仅凭文本就创建了大量的生动图像。

 

DALL·E算法是GPT-3的衍生产品,它通过检测训练中的模式,根据简单的文本提示生成了栩栩如生的图像。

 

构建蛋白质功能位点也是类似的。

 

其中,氨基酸是字母,蛋白质的功能位点是图像。神经网络可以通过训练来观察数据中的模式。训练结束,便可以对它进行测试,检测它是否能产生一个还算不错的解决方案。

 

该团队从之前的产品trRosetta入手。这是一个神经网络,最初的设计目的是基于氨基酸序列来构建新的蛋白质,同时能够预测它们的结构。

 


这个算法看起来很完美,因为它既能预测蛋白质的氨基酸序列,又能预测其结构。

 

然而,它并没有真正起作用。相比之下,RoseTTAFold表现得更为出色。

 

这个算法的强大之处就在于它的设计,即在纳米尺度上对每个氨基酸进行建模,为每个原子提供坐标。

 

RoseTTAFold可以就手头问题去预测一个特定的功能结构,并提出一个粗略的草图作为最终设计。

 

不过,研究小组隐藏了部分蛋白质序列(或结构)。

 

这款软件必须学会如何从嘈杂的无线电拦截中破译信息,也就是说,在这种情况下,你只能听到前几个单词,然后通过填空理解其真实含义。

 

RoseTTAFold解决了「缺失信息恢复问题」,自动完成氨基酸序列和结构,以高保真度构建了给定的功能区。

 

RoseTTAFold可以同时解决构建氨基酸序列,并为该位点生成骨架的问题。这就像把单词写在纸上:写信人除了要确保拼写无误,还要检查语法和语义是否正确。

 

该团队对他们的新发明进行了测试,设计出了几种药物和疫苗,这些药物和疫苗可能会成功对抗病毒和癌症。

 

在进行该项目期间,Jue Wang博士两岁的儿子因RSV肺部感染而住院,这种病毒通常表现出类似感冒的症状,但对小孩和老年人来说可能是致命的。

 

当时,Jue Wang博士正在使用该算法设计新的治疗方法,其中包括RSV上的潜在位点,以进一步测试疫苗和药物。这是一个相对良好的结构。

 

这个软件的设计概括了该疫苗可能结合的两个位点。深度学习方法在此奏效了!

 

 

在其他的几个测试中,该团队还为酶、蛋白质结合蛋白和抓住金属离子的蛋白质设计了功能位点。

 

这种方法为揭开天然蛋白质的神秘面纱打开了大门,同时也可能为合成生物学设计新的蛋白质。

 

总之,这是深度学习的另一个胜利,也是人工智能和生物学巧妙结合的「作品」。


参考资料:https://singularityhub.com/2022/07/26/protein-designing-ai-opens-door-to-medicines-humans-couldnt-dream-up/

相关文章
|
11月前
|
机器学习/深度学习 人工智能 供应链
从概念到商业价值:AI、机器学习与深度学习全景指南
在这个科技飞速发展的时代🚀,人工智能正以惊人的速度渗透到我们的生活和工作中👀。但面对铺天盖地的AI术语和概念,很多人感到困惑不已😣。"AI"、"机器学习"、"深度学习"和"神经网络"到底有什么区别?它们如何相互关联?如何利用这些技术提升工作效率和创造价值?
615 0
|
机器学习/深度学习 人工智能 编解码
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态
在生物医学领域,蛋白质的结构与功能研究至关重要。ByteDance Research团队开发的CryoSTAR软件,结合AI与冷冻电镜技术,通过深度学习模型、结构先验和异质性重构算法,成功解析了蛋白质的动态行为,尤其在处理结构异质性方面表现出色。该软件已在多个蛋白质体系中取得显著成果,如TRPV1通道蛋白的动态变化研究,为理解蛋白质功能及疾病机制提供了新思路。论文链接:https://www.nature.com/articles/s41592-024-02486-1
432 26
|
9月前
|
机器学习/深度学习 人工智能 PyTorch
AI 基础知识从 0.2 到 0.3——构建你的第一个深度学习模型
本文以 MNIST 手写数字识别为切入点,介绍了深度学习的基本原理与实现流程,帮助读者建立起对神经网络建模过程的系统性理解。
854 15
AI 基础知识从 0.2 到 0.3——构建你的第一个深度学习模型
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
AI 基础知识从 0.3 到 0.4——如何选对深度学习模型?
本系列文章从机器学习基础出发,逐步深入至深度学习与Transformer模型,探讨AI关键技术原理及应用。内容涵盖模型架构解析、典型模型对比、预训练与微调策略,并结合Hugging Face平台进行实战演示,适合初学者与开发者系统学习AI核心知识。
715 15
|
人工智能 前端开发 算法
Vibe Draw:涂鸦秒变3D模型!开源AI建模神器解放创意生产力
Vibe Draw 是一款基于AI技术的开源3D建模工具,通过Next.js和FastAPI构建,能将用户绘制的2D草图智能转化为3D模型,并支持文本提示优化和场景构建。
913 35
Vibe Draw:涂鸦秒变3D模型!开源AI建模神器解放创意生产力
|
人工智能 并行计算 PyTorch
TripoSR:开源3D生成闪电战!单图0.5秒建模,Stability AI颠覆设计流程
TripoSR是由Stability AI和VAST联合推出的开源3D生成模型,能在0.5秒内从单张2D图像快速生成高质量3D模型,支持游戏开发、影视制作等多领域应用。
891 13
TripoSR:开源3D生成闪电战!单图0.5秒建模,Stability AI颠覆设计流程
|
人工智能 JSON 自然语言处理
让AI听懂你的建模需求!BlenderMCP:自然语言指令直接操控 Blender,一句话生成复杂3D场景
BlenderMCP通过MCP协议实现Blender与Claude AI的无缝集成,支持通过自然语言指令完成3D建模、材质调整等复杂操作,显著提升创作效率。
1550 1
让AI听懂你的建模需求!BlenderMCP:自然语言指令直接操控 Blender,一句话生成复杂3D场景
|
机器学习/深度学习 人工智能 运维
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
494 8
|
机器学习/深度学习 人工智能 算法
ProtGPS:MIT再造生命科学新基建!蛋白质AI一键预测定位+设计新序列,登Nature子刊
ProtGPS 是麻省理工学院和怀特黑德研究所联合开发的蛋白质语言模型,能够预测蛋白质在细胞内的亚细胞定位,并设计具有特定亚细胞定位的新型蛋白质。
1095 17
ProtGPS:MIT再造生命科学新基建!蛋白质AI一键预测定位+设计新序列,登Nature子刊
|
机器学习/深度学习 人工智能 搜索推荐
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
BioEmu 是微软推出的生成式深度学习系统,可在单个 GPU 上每小时生成数千种蛋白质结构样本,支持模拟动态变化、预测热力学性质,并显著降低计算成本。
801 2
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半

热门文章

最新文章

下一篇
开通oss服务