魔搭中文开源模型社区:模型即服务-药物设计中的开源AI模型Uni-Fold及Uni-Mol(下)

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 魔搭中文开源模型社区:模型即服务

三、 Uni-Mol概览

 

image.png

 

近年来,预训练在药物设计中获得了巨大的关注。早期的MRL模型直接使用NLP模型,如BERT,从SMILES等一维序列中学习。最近的MRL模型使用图模型,从二维分子图中学习。

 

image.png

 

如果科研人员需要提高分子的特性和药物的效果,主要由三维结构决定。为了扩大应用范围,许多任务需要3D位置输出,如构象生成、结合姿势预测等。

 

近期的一些MRL模型试图利用三维模型,将其作为辅助信息。比如ChemRL-GEM将键长/角度添加到边缘特征中,GraphMVP/3D-InfoMax将三维信息提炼成二维图形。

 

image.png

 

与现有大多数分子表征学习模型的不同之处在于,Uni-Mol跳出大多模型所采用的一维序列或二维图结构,而是直接利用分子三维结构作为模型输入和输出,利用分子的三维信息训练模型。

 

三维MRL框架Uni-Mol由三个部分组成,基于Transformer的骨干处理3D数据、学习分子表征和口袋表征的预训练模型、以及面向各类下游任务的微调策略。

 

image.png

 

目前,Uni-Mol可以做任务有三类。分别是小分子,蛋白口袋,以及蛋白跟小分子结合的复合物。

 

image.png

 

如上图所示,蛋白质与配体结合的预测,是基于结构的药物设计中最重要的任务之一。Uni-Mol结合了分子和口袋预训练模型来学习基于距离矩阵的打分函数,后对复杂的构象进行采样和优化,并在基准数据集上确保了结果的可泛化性。

 

通过结合分子模型和口袋预训练模型,Uni-Mol在蛋白质与配体结合任务中显著超过了普遍使用的对接工具。

 

image.png

 

在预训练任务方面,主要对三维空间进行去噪。假设有一个碳原子,在真实坐标随机添加一些扰动,然后屏蔽原子预测,如同遮蔽的语言建模。模型将原子进行还原之后,它还是原来的原子类型。

 

image.png

 

如上图所示,Uni-Mol在docking power和binding pose两项评估结合最关键的指标上,Uni-Mol均表现非常出色,在打分函数docking power测评上超越了一系列主流的docking工具以及AI based打分函数模型。

 

image.png

 

除此之外,Uni-Mol在binding pose预测能力上面,对于CASF-2016基准数据集的预测,通过准确结合构象的比例,目前已超过主流的docking工具约35%。

 

image.png

 

Uni-Mol是第一个可以直接用于蛋白质-配体对接的MRL,生成三维结合位置,与传统对接工具相比,速度提高100倍。

 

image.png

 

目前,Uni-Mol已全面开源,其代码、模型、数据、论文均在网上公开。

 

image.png

 

除此之外,Uni-Mol所有资料均已在ModelScope社区开放,欢迎大家使用。

 

 

 

 

相关文章
|
18天前
|
机器学习/深度学习 人工智能 算法
整合海量公共数据,谷歌开源AI统计学专家DataGemma
【10月更文挑战第28天】谷歌近期开源了DataGemma,一款AI统计学专家工具,旨在帮助用户轻松整合和利用海量公共数据。DataGemma不仅提供便捷的数据访问和处理功能,还具备强大的数据分析能力,支持描述性统计、回归分析和聚类分析等。其开源性质和广泛的数据来源使其成为AI研究和应用的重要工具,有助于加速研究进展和推动数据共享。
45 6
|
6天前
|
人工智能 开发框架 搜索推荐
今日 AI 开源|共 10 项| 复合 AI 模型,融合多个开源 AI 模型组合解决复杂推理问题
今日 AI 简报涵盖多项技术革新,包括多模态检索增强生成框架、高保真虚拟试穿、视频生成、生成式软件开发、上下文感知记忆管理等,展示了 AI 在多个领域的广泛应用和显著进步。
55 10
今日 AI 开源|共 10 项| 复合 AI 模型,融合多个开源 AI 模型组合解决复杂推理问题
|
18天前
|
存储 人工智能 SEO
全开源免费AI网址导航网站源码
Aigotools 可以帮助用户快速创建和管理导航站点,内置站点管理和自动收录功能,同时提供国际化、SEO、多种图片存储方案。让用户可以快速部署上线自己的导航站。
42 1
|
20天前
|
人工智能 Anolis 开发者
|
1月前
|
机器学习/深度学习 人工智能 算法
AI在药物研发中还有哪些应用场景呢
【10月更文挑战第16天】AI在药物研发中还有哪些应用场景呢
253 0
|
机器学习/深度学习 TensorFlow 算法框架/工具
阿里云弹性AI服务 -- 基于Docker和EGS一键创建高性能Tensorflow分布式训练
Tensorflow是目前使用最为广泛的深度学习框架之一,但是目前搭建分布式多机多卡训练比较困难,而且Tensorflow原生的分布式的性能很差。为了解决这个问题,我们创建了一个容器镜像:registry.
5037 0
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
37 1
|
5天前
|
机器学习/深度学习 人工智能 算法
AI在医疗诊断中的应用
【10月更文挑战第42天】本文将探讨人工智能(AI)在医疗诊断中的应用,包括其优势、挑战和未来发展方向。我们将通过实例来说明AI如何改变医疗行业,提高诊断的准确性和效率。

热门文章

最新文章

下一篇
无影云桌面