ATPdock:一种基于模板的ATP特异性蛋白质-配体对接方法

简介: ATPdock:一种基于模板的ATP特异性蛋白质-配体对接方法

编辑 | 萝卜皮准确识别蛋白质-ATP 结合位姿对于基础结构生物学和药物发现都具有重要意义。尽管已经设计了许多对接方法,但大多数都需要用户定义的结合位点,很难达到高质量的蛋白质-ATP对接结果。开发一种没有用户定义的结合位点的蛋白质-ATP 特异性盲对接方法至关重要。在这里,浙江工业大学的研究人员介绍了 ATPdock,这是一种基于模板的方法,用于将 ATP 与蛋白质对接。对于每个查询蛋白,如果没有给出口袋位点,ATPdock 首先使用 ATPbind(一种 ATP 结合位点预测器)识别其最有潜力的口袋;然后,使用口袋结构对齐工具 APoc 从口袋-配体结构数据库中搜索与给定或识别口袋最相似的模板口袋;第三,使用配体结构对齐工具LS-align生成ATP的粗对接位姿(rdATP),将初始ATP位姿与模板口袋对应的模板配体对齐;最后,在 AutoDock Vina 能量函数的指导下,利用 Metropolis Monte Carlo 模拟对 rdATP 进行微调。基准测试表明,ATPdock 在对接精度方面明显优于其他最先进的方法。该研究以「ATPdock: a template-based method for ATP-specific protein–ligand docking」为题,于 2022 年 1 月 15 日刊载在《Bioinformatics》。ATPdock的性能评估ATPdock 使用两个最先进的蛋白质-配体对接程序(AutoDock Vina 和 DOCK6)在 88 种蛋白质-ATP 复合物上进行了测试。在 88 个复合物中有 94 个天然和 88 个 ATPbind 预测的口袋 ATP 结合位姿。使用 APoc 和 LS-align 算法,对于每个查询口袋,ATPdock 可以从 PLDB 数据库中搜索具有最高相似性的模板口袋-配体结构。结果显示了在提供原生和 ATPbind 预测的口袋信息的条件下相应的相似性值。鉴于原生 ABP 信息,ATPdock 在 94 个口袋 ATP 结合姿势上的平均 RMSD 值可以达到 3.41 Å,分别比 AutoDock Vina 和 DOCK6 低 53.9% 和 45.3%。鉴于 ATPbind 预测的 ABP 的信息,ATPdock 的平均 RMSD 值比两个控制程序,即 AutoDock Vina 和 DOCK6 的平均 RMSD 值低 39.8% 和 40.2%。此外,通过重新访问图 1A 和 B,很容易看出从 PLDB 数据库中搜索的口袋配体模板可用于帮助提高 AutoDock Vina 和 DOCK6 的性能。

图1:ATPdock的性能评估。(来源:论文)

表 1 显示了 Student t-test 中 ATPdock 和 Vina、VinaTM、DOCK6 和 DOCK6TM 在两种不同给定信息上的 RMSD 差异的 P 值。从表 1 中不难看出,在给出原生口袋信息时,ATPdock 与其他对接方法之间的 P 值均 <10^4。这里,上标 TM 表示 rdATP 在相应的对接方法中用作初始状态。表1:在两种不同给定信息上的 RMSD 差异 P 值。(来源:论文)此外,图 1C 提供了一个说明性示例,将 ATP 对接到查询蛋白的天然口袋(PDB ID:3GBUA),其中 ATPdock 的对接结果在所有对接结果中具有最低的 RMSD(1.49 Å)。图 1D 显示了将 ATP 对接到查询蛋白的 ATPbind 预测口袋中的另一个示例(PDB ID:5D9HB),其中 ATPdock 的对接结果在所有对接结果中具有最低的 RMSD(1.63 Å)。图 2 显示了在给出天然和 ATPbind 预测口袋的条件下 RMSD 的分布。图 2:ATPdock、Vina、DOCK6、VinaTM 和 DOCK6TM 在原生和 ATPbind 预测口袋条件下对接结果的 RMSD 分布。(来源:论文)实际上,搜索到的口袋配体模板的质量越高,ATPdock 的性能就越好。除了使用的口袋配体模板外,ATPdock 的高对接精度可部分归因于 Metropolis Monte Carlo 模拟。图 3 显示了一个案例研究,其中使用 Metropolis Monte Carlo 的模拟导致与没有 Metropolis Monte Carlo 程序的完全不同的对接姿势;前者的 RMSD 比后者低 21.6%。图 3:ATPdock在5DB4A上的对接结果。(来源:论文)ATPdock 的网络服务器唯一的强制性输入是 PDB 格式的查询蛋白质结构信息。ATPdock 的网络服务器还允许用户可选地输入一个或多个 ABP 信息以生成一个或多个相应的 ATP 绑定姿势。如果没有输入 ABP,使用 ATPbind 生成一个或多个 ABP 需要额外的几个小时。对于每个 ATPdock 生成的 ATP 绑定姿势,由 NGL Viewer 实现的四个交互式小程序,用于可视化查询和搜索模板袋的叠加结构,初始 ATP 和搜索的模板配体的叠加结构,查询口袋和初始 ATP 的粗对接结构,通过将它们与搜索的口袋-配体模板对齐获得,以及最终对接结构。ATPdock 网络服务器可以轻松扩展以将 ATP 样(甚至通用)配体停靠到受体蛋白中。未来,研究人员还应该使用其他搜索方案来快速找到 ATP 或其他配体类型的最佳对接姿势。ATPdock 独立程序:https://github.com/jun-csbio/ATPdockATPdock 网络服务器和数据集:https://jun-csbio.github.io/atpdock/论文链接:https://academic.oup.com/bioinformatics/article-abstract/38/2/556/6373371?redirectedFrom=fulltext&login=false

相关文章
|
6月前
|
人工智能 文字识别 计算机视觉
【AAAI 2024】M2Doc:文档版面分析的可插拔多模态融合方法
M2Doc是一种创新的多模态融合方法,设计用于增强文档版面分析任务中的纯视觉目标检测器。该方法包括Early-Fusion和Late-Fusion模块,前者通过门控机制融合视觉和文本特征,后者则在框级别合并这两种特征。M2Doc易于集成到各种目标检测器,实验证明它能显著提升DocLayNet和M6Doc数据集上的性能,特别是与DINO结合时,在多个数据集上达到SOTA结果。此外,研究表明M2Doc对于增强复杂逻辑版面分析任务中的文本理解和语义关联特别有效。
|
机器学习/深度学习 算法 网络安全
决策树算法在文档管理系统中的应用:智能文档分类与组织
决策树算法是一种常用的机器学习算法,在分类问题中被广泛应用。该算法通过将原始数据集拆分成多个小的决策子集,以生成一个决策树,用于预测新数据的分类。
138 1
|
数据处理 Python
doccano数据标注平台搭建
基于阿里云服务器ESC示例,搭建doccano数据标注平台
|
数据可视化 大数据 定位技术
I+关系网络分析发布,提供完整的可视化分析和关系引擎功能
I+关系网络分析是以OLP模型为核心,面向业务快速建模,为开发者和终端用户提供大数据关系计算引擎(含API服务)和可视化交互分析能力,面向安防、关税、银行、保险、互联网等提供的产品化方案。目前,I+关系网络分析已在阿里巴巴、蚂蚁金服集团内广泛应用于反欺诈、反作弊、反洗钱等风控业务。
4546 0
|
5月前
|
机器学习/深度学习 人工智能 前端开发
人工智能平台PAI产品使用合集之创建了实时特征视图,里面的数据是通过什么传入的
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
6月前
|
数据库 数据库管理
构建信息蓝图:概念模型与E-R图的技术解析
构建信息蓝图:概念模型与E-R图的技术解析
127 0
|
6月前
|
人工智能
全方位解析PAI:数据准备、模型开发、模型训练一网打尽
全方位解析PAI:数据准备、模型开发、模型训练一网打尽 随着人工智能技术的飞速发展,越来越多的企业开始关注并投入到AI的研发中。然而,AI的研发并非易事,从数据准备、模型开发、模型训练到模型服务,每一个环节都需要专业的工具和平台来支持。阿里云的PAI(Powered by AI)正是一个涵盖了数据准备、模型开发、模型训练、模型服务全流程的AI工作平台。本文将为您详细介绍PAI的各个子产品的产品线上规格及使用指引。
162 2
|
6月前
|
Ubuntu 数据可视化 Shell
一键访问多功能数据解决方案:如何轻松构建和管理APITable智能多维表格
一键访问多功能数据解决方案:如何轻松构建和管理APITable智能多维表格
102 0
|
6月前
|
存储 搜索推荐 分布式数据库
用户画像标签系统体系解释
用户画像标签系统体系解释
332 1
|
6月前
|
传感器 XML JSON
AIOT-物模型(产品模型、数据模板)
使用 TSL 描述的物联网中的实体模型,就是“物模型”也称产品模型、数据模板。
576 0