PNAS | 开发用于优化蛋白质设计的3D模型

简介: PNAS | 开发用于优化蛋白质设计的3D模型

研究人员开发了一个计算程序,以帮助设计治疗用蛋白质,预测相互作用。

image.png

研究人员已经开发出一种过程,他们说这种过程可以减少计算蛋白设计所涉及的工作。该技术使用三维(3D)结构模型来预测分子嵌段的新颖组合如何协同工作以实现所需的效果。


来自美国达特茅斯学院的研究小组建议,专注于相对较少数量的蛋白质亚结构,而不是无限数量的原子级组合,可以简化新药物和新材料的开发。


达特茅斯大学计算机科学副教授,该研究的高级研究员Gevorg Grigoryan说:“设计建筑物时,您不一定需要了解沙粒在一块砖中如何相互作用。” “由于您知道什么是砖块以及它的特性是什么,您可以专注于砖块如何组合在一起以形成所需的形状。采用的相同方法,只关注知道起作用的蛋白质亚结构。”

image.png

尽管许多治疗药物是从天然存在的蛋白质中产生的,但自定义领域尚未发展为允许合成蛋白质的广泛开发。开发合成蛋白的障碍中,绝大多数是可能的氨基酸组合。对组合进行分类以找到在任何给定情况下都将有用的组合是一个耗时且资源密集的过程。


目前,开发新药的研究人员专注于特定原子之间的相互作用。这种方法要求实验室建立大型的变体库,以找到可以完成指定任务的变体。尽管这可以产生有用的结果,但研究人员发现建立具有高精确度的原子模型具有挑战性。


序列的数量实际上是无限的,确实使寻找合适的组合来满足特定治疗需求的过程变得复杂。为了开发一种优化的设计方法,研究小组扫描了包含150,000种已知蛋白质的3D模型的数据库。他们发现蛋白质中经常会出现少量结构模式,并且蛋白质结构中的许多多样性都来自于这些结构单元的组合方式。这一发现使研究小组提出了一个假设,即与其将蛋白质建模为相互作用的原子的复杂网络,不如将它们更简单地表示为一组有限的结构构件的组合。

image.png

研究人员说,使用这种新方法,可以更容易地根据建立的模式来判断新的蛋白质结构。该方法使科学家能够参考已知结构的库,从而轻松地尝试更具创意的设计。


Grigoryan说,“这项技术使挑战完全摆脱了在原子尺度上绝对正确的物理学的挑战,从而有可能使计算蛋白质的设计成为一个更加可靠的过程。他们的发现应该为蛋白质设计中的机器学习打开大门。”


新工艺着眼于蛋白质中存在的较大原子块(称为第三基序),以设计功能性蛋白质。这些是反复出现的结构布置,类似于建筑物中的拱门或立柱,可用于设计新颖的蛋白质而无需考虑其原子级组成。


由于这些结构仅以某些方式结合在一起,因此研究人员将不再需要进行原子级的猜测。取而代之的是,他们只需要专注于装配在一起的嵌段,而忽略那些不会形成功能蛋白的结构。


根据研究论文,结果“有力地证明了蛋白质数据库现在已经足够大,可以仅通过使用不相关蛋白质的结构基序实例来设计蛋白质。”

image.png

通过应用这项新技术,研究团队希望首先通过依靠这些原理来消除在蛋白质结构中重新发现物理原理的冗余。

目录
打赏
0
0
0
0
15
分享
相关文章
《面向对象分析与设计》一3.6 用况模型与OOA模型
本节书摘来自华章出版社《面向对象分析与设计》一书中的第3章,第3.6节,作者 麻志毅,更多章节内容可以访问云栖社区“华章计算机”公众号查看
1102 0
大模型开发:描述模型可解释性的重要性以及如何实现它。
模型可解释性在AI和机器学习中至关重要,尤其在金融风控等领域,它关乎信任、公平性和法规合规。通过建立信任、发现偏见、排查错误和满足法规要求,可解释性促进了模型的改进和社会接受度。研究者采用简单模型、局部和全局解释方法、模型可视化及原型/反例等策略提升模型透明度。这是一项结合算法、专业知识和伦理的跨学科挑战。
468 1
大模型开发:描述集成学习以及它如何工作。
【4月更文挑战第24天】集成学习通过结合多个模型预测提升整体性能,减少偏差和方差。主要分为Bagging和Boosting两类。Bagging中,模型并行在数据子集上训练,如随机森林,通过投票或平均聚合预测。Boosting则顺序训练模型,聚焦纠正前一个模型的错误,如AdaBoost,加权组合所有模型预测。Stacking则是用基础模型的输出训练新模型。关键在于模型多样性以捕捉数据不同模式。集成学习广泛应用于分类、回归等任务,能提高泛化能力,降低过拟合风险。
85 3
|
10月前
多水平模型、分层线性模型HLM、混合效应模型研究教师的受欢迎程度
多水平模型、分层线性模型HLM、混合效应模型研究教师的受欢迎程度
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等