秒杀AlphaFold!Science:用AI一秒设计自然界全新蛋白质(1)

简介: 秒杀AlphaFold!Science:用AI一秒设计自然界全新蛋白质

【新智元导读】利用AI,我们现在可以在几秒之内设计出自然界中全新的蛋白质了。最近,来自华盛顿大学的科学家在Science上连发两篇论文,介绍了ProteinMPNN算法工具。


过去两年,机器学习彻底改变了蛋白质结构预测。

而现在,人工智能又在蛋白质设计领域引发了新一轮革命。

生物学家发现,使用机器学习,可以在几秒钟内创建出蛋白质分子。而在以前,这个时间也许是几个月。

并且,新方法准确率也更高。

9月15日,华盛顿大学医学院的生物学家在Science上连发两篇论文,介绍了他们的重大发现。

论文地址:https://www.science.org/doi/10.1126/science.add2187

也许你会问:创造出自然界中没有的蛋白质,对我们有什么意义?

意义可太大了。通过这些蛋白质,也许我们会开发出更多疫苗,加快治疗癌症的研究,研发出碳捕获工具,和全新的可持续生物材料。

论文地址:https://www.science.org/doi/10.1126/science.add1964

ProteinMPNN:蛋白质设计的革命

这几年,已经有几十种人工智能蛋白质设计工具被开发了出来,研究人员可以混合和匹配各种方法来得出一个可行的最终设计。

下面,我们就简单介绍一下其中的4种方法:

固定骨架设计

给定一个预设蛋白质结构,然后用Al确定该蛋白质的氨基酸序列。

序列生成

利用语言模型,让AI学会如何生成蛋白质。然后通过微调这些神经网络,得到特定蛋白质家族成员的新序列。

结构生成

对蛋白质结构进行训练的神经网络可以生成完全新颖的蛋白质结构,但往往对输出的控制有限。

序列和结构设计

使用一种叫做inpainting的方法,研究人员输入他们希望包含在蛋白质中的结构或序列,而Al网络则填补其余部分。

在这两篇新论文中,华盛顿大学医学院的生物学家表示,机器学习可用于比以前更准确、更快速地创建蛋白质分子。

David Baker是华盛顿大学医学院生物化学教授、2021年生命科学突破奖获得者。

据他介绍:「蛋白质是整个生物学的基础,但是要知道,现在我们在每种植物、动物和微生物中发现的所有蛋白质,都还不到所有可能的蛋白质的百分之一。有了这些新的软件工具,研究人员也许就能够找到长期的解决方案,去攻克医学、能源和技术上的难题。」

在自然界中,蛋白质被称为「生命的基石」,因为它们在所有生物的结构中都是必不可少的。在一个细胞生长、分裂、修复的每一个过程中,几乎都有蛋白质的参与。

可以说,蛋白质基本解决了生命的所有问题,生物学中的一切都发生在蛋白质上。

Baker介绍说:「为了解决生物体在进化过程中面临的问题,它们在进化中不断演变。人类今天在面临着新的问题,比如新冠病毒。如果我们能设计出一种新的蛋白质,让它像在进化过程中演变出的蛋白质一样,解决种种问题,那它的力量将是非常强大的。」

在生物的数百万年进化中,蛋白质的演化痕迹使科学家能够快速破译数百种蛋白质的3D形状

蛋白质由数十万个氨基酸组成,这些氨基酸以长链的形式连接起来。蛋白质中的氨基酸序列决定了它的三维形状。这种复杂的形状对于蛋白质的功能至关重要。

在2020年,人工智能实验室DeepMind宣布AlphaFold时,就已经让全世界大吃一惊了。这个AI工具利用深度学习,解决了生物学的一个大挑战:准确预测蛋白质的形状。而今年夏天,DeepMind宣布,AlphaFold现在可以预测科学上已知的所有蛋白质的形状。

通过预测蛋白质的结构,就可以洞察它们的表现。

在蛋白质预测领域,科学家已经取得了举世瞩目的惊人成绩。而在蛋白质设计领域, Baker的团队也取得了突破性进展。





相关文章
|
机器学习/深度学习 人工智能 编解码
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态
在生物医学领域,蛋白质的结构与功能研究至关重要。ByteDance Research团队开发的CryoSTAR软件,结合AI与冷冻电镜技术,通过深度学习模型、结构先验和异质性重构算法,成功解析了蛋白质的动态行为,尤其在处理结构异质性方面表现出色。该软件已在多个蛋白质体系中取得显著成果,如TRPV1通道蛋白的动态变化研究,为理解蛋白质功能及疾病机制提供了新思路。论文链接:https://www.nature.com/articles/s41592-024-02486-1
392 26
|
8月前
|
机器学习/深度学习 人工智能 API
基于昇腾适配Meta AI在Science正刊发表的蛋白质结构预测模型ESMFold
ESMFold是由Meta AI团队开发的一种基于深度学习的高效蛋白质结构预测模型,其核心目标是利用大规模蛋白质语言模型(ESM)直接从氨基酸序列快速推断蛋白质的三维结构。ESMFold通过预训练的语言模型捕捉序列中的进化与结构关联性,结合几何优化模块生成高精度原子坐标,显著降低了传统方法对多重序列比对(MSA)和模板依赖的计算成本。该模型在蛋白质从头预测(de novo prediction)、功能位点解析、突变效应模拟等领域具有重要价值,以高效的推理性能,推动结构预测技术的普惠化应用。
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
AI 加速科学发现丨Al For Science 专场直播
AI 科学家时代正加速到来,但科研智能体真的做好准备了吗?真实科研场景中,多模态智能体能否在推理、规划与执行等关键能力上达到人类科研人员的水平?我们又该如何准确评估它们的科学认知能力和数据分析表现?
173 0
|
12月前
|
机器学习/深度学习 人工智能 算法
ProtGPS:MIT再造生命科学新基建!蛋白质AI一键预测定位+设计新序列,登Nature子刊
ProtGPS 是麻省理工学院和怀特黑德研究所联合开发的蛋白质语言模型,能够预测蛋白质在细胞内的亚细胞定位,并设计具有特定亚细胞定位的新型蛋白质。
971 17
ProtGPS:MIT再造生命科学新基建!蛋白质AI一键预测定位+设计新序列,登Nature子刊
|
12月前
|
机器学习/深度学习 人工智能 搜索推荐
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
BioEmu 是微软推出的生成式深度学习系统,可在单个 GPU 上每小时生成数千种蛋白质结构样本,支持模拟动态变化、预测热力学性质,并显著降低计算成本。
693 2
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
|
机器学习/深度学习 人工智能
斯坦福伯克利重磅发现DNA Scaling Law,Evo荣登Science封面!AI设计DNA/RNA/蛋白质再突破
近日,斯坦福大学和加州大学伯克利分校在《科学》杂志发表重要成果,发现DNA Scaling Law规律,揭示了DNA、RNA和蛋白质分子长度与碱基对数量之间的比例关系。该研究为AI设计生物分子带来突破,通过数据收集、模型训练和优化设计等步骤,显著提高设计效率和准确性,降低成本,并拓展应用范围。论文地址:https://www.science.org/doi/10.1126/science.ado9336。
313 26
|
人工智能 自然语言处理 算法
于云栖处,探索 AI+Science 的大规模工程化
在语音识别、图片搜索和数据处理等功能遍布于个人设备,将人们从繁琐、机械的工作中解放出来的同时,在科学领域,AI正在蓄力等待一个深入渗透进生物、化学、物理、工程等基础科学领域的契机。
于云栖处,探索 AI+Science 的大规模工程化
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1081 51
|
5月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1182 57
|
4月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
595 30