谷歌提前开源AlphaFold 2！Nature、Science同时公开两大蛋白质结构预测工具（二）

2022-01-16 432

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 昨日，DeepMind和华盛顿大学分别在nature和Science两大顶级杂志发布了各自预测蛋白质结构的工具，并同时开源了代码。

DeepMind表示，AlphaFold 2可以对蛋白质的基本物理结构进行十分准确的预测，并能够在几天内生成高精度的结构。此外，模型还能利用内部的内部置信度来预测每个预测的蛋白质结构中哪些部分是可靠的。训练数据来自大约17万个蛋白质结构，以及包含未知结构的蛋白质序列的大型数据库。期间DeepMind使用了16个TPU进行训练（即128个TPUv3核心或大致相当于约100-200个GPU）。

神经网络模型结构其中，模型对蛋白质序列以及氨基酸残基对进行操作，在两种表征之间迭代传递信息以生成结构。

AlphaFold生成的蛋白质高精度结构

架构细节

RoseTTAFold：媲美AlphaFold 2的预测工具

无独有偶，隔壁Science杂志也刊登了另一个蛋白质结构预测的工具，名叫「RoseTTAFold」，特点是「快、准、狠」。 2020年，DeepMind在CASP 14大会上介绍了它在该蛋白质结构预测上的显著进展。华盛顿大学医学院蛋白质设计研究所的研究人员看在眼里，受其启发，与哈佛、剑桥、德克萨斯大学西南医学中心、劳伦斯伯克利国家实验室联手，共同研发了一款基于深度学习的蛋白质结构预测工RoseTTAFold。这款工具利用深度学习，仅凭有限的信息，就能在普通游戏本上快速而准确地预测蛋白质结构，在短时间就能构建出复杂的生物组建模型。目前，该研究团队已经用RoseTTAFold计算出了数百种新的蛋白质结构，其中就包括了许多鲜为人知的人类基因组蛋白。 RoseTTAFold预测出了与脂质代谢问题、炎症紊乱和癌细胞生长相关的蛋白质结构。 RoseTTAFold是一个「三轨」神经网络（"three-track" neural network），它能够兼顾蛋白质序列模式、氨基酸如何相互作用以及蛋白质三维结构的可能性。在这个架构中，信息在一维（氨基酸序列）、二维（距离）和三维（坐标）之间来回流动，从而能够集中推理出蛋白质化学部分与折叠结构之间的关系。

RoseTTAFold 架构包含一、二、三维注意力轨道，轨道之间信息能够来回流动在CASP14目标取得的平均TM-score

在CAMEO实验中取得的盲基准结果蛋白质结构预测不断取得新进展，最关键的问题莫过于：能够使用什么准确的蛋白质结构模型？团队研究了RoseTTAFold通过X射线晶体学和低温电子显微镜，研究了促进实验结构测定实用性，为目前为之结构的关键蛋白质提供模型。 RoseTTAFold方法的准确性远高于现有方法，因此，研究人员希望能够测试出这款工具是否能够解决分子置换（MR）这一从未解决的问题。在蛋白质数据库（PDB）中，有四种蛋白无法用MR解决：牛属甘氨酸N-酰基转移酶（GLYAT）、细菌氧化还原酶、细菌表面层蛋白（SLP）和来自真菌平革菌属金孢子菌属的分泌蛋白，因此研究人员使用RoseTTAFold重新分析蛋白质结构。

由于蛋白质结构的测定能够为生物功能和机制提供大量见解，团队也研究了RoseTTAFold是否也能有这样的功能。研究人员主要针对两组蛋白：目前未知结构的G蛋白偶联受体；与疾病相关的人类蛋白质。研究结果发现，即使没有已知结构的密切同源物，RoseTTAFold模型在活性和非活性状态下也能做到准确预测构型。

研究人员使用RoseTTAFold工具，从序列信息中预测了大肠杆菌蛋白复合物的结构。图A中，灰色表示第一条亚基，彩色表示第二条亚基。图C是RoseTTAFold生成的IL-12R/IL-12复合结构。论文一作Minkyung Baek希望RoseTTAFold这个新工具未来能够造福整个研究领域。

谷歌提前开源AlphaFold 2！Nature、Science同时公开两大蛋白质结构预测工具（二）

RoseTTAFold：媲美AlphaFold 2的预测工具

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

谷歌提前开源AlphaFold 2！Nature、Science同时公开两大蛋白质结构预测工具（二）

RoseTTAFold：媲美AlphaFold 2的预测工具

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景