备案控制台

开发者社区 ModelScope模型即服务文章正文

Uni-Mol：分子3D表示学习框架和预训练模型项目原作解读

2023-05-17 500

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型训练 PAI-DLC，100CU*H 3个月

交互式建模 PAI-DSW，每月250计算时 3个月

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

简介： Uni-Mol：分子3D表示学习框架和预训练模型项目原作解读

预训练模型正在席卷 AI 领域。从大规模无标注数据中提取表征信息，再在小范围标注的下游任务上进行监督学习，正在成为很多领域的事实解决方案。NLP 中有 BERT、GPT-3，CV 中有 ViT，而这样的模式如何助力药物设计，也一直都是人们密切关注的问题。药物分子与图片、语言文字的不同之处在于，“什么是最好的分子表征”依旧是一个人们未能形成共识的问题。主流分子预训练模型均从一维序列或二维图结构出发，但分子结构本身是在三维空间中表示的。能否直接从三维信息出发构建预训练模型、获得更好的分子表征，是一个重要而有意义的问题。

近日，深势科技团队发布了首个三维分子预训练模型 Uni-Mol。Uni-Mol 直接将分子三维结构作为模型输入，而非采用一维序列或二维图结构，在利用 2 亿个分子三维构象和 3 百万个蛋白候选口袋数据进行预训练后，Uni-Mol 在几乎所有与药物分子和蛋白口袋相关的下游任务上都超越了 SOTA（state of the art），也让 Uni-Mol 得以能够直接完成分子构象生成、蛋白-配体结合构象预测等三维构象生成相关的任务，并超越现有解决方案。

文章标签：

计算机视觉

自然语言处理

知识图谱

人工智能

-开发达人-

目录

相关文章

城市大脑生态运营

|

存储弹性计算安全

医保行业 | 智慧医保

本文介绍了医保行业 | 智慧医保的方案概述，方案价值及优势以及最佳实践。

城市大脑生态运营

4991 0 0

java菌

如何用限制立方样条（RCS）做生存分析？

如何用限制立方样条（RCS）做生存分析？

java菌

884 0 0

如何用限制立方样条（RCS）做生存分析？

aliyun9170107523-43660

|

2月前

|

数据采集人工智能自然语言处理

52_领域模型：BioBERT与FinBERT

在大语言模型(LLM)快速发展的今天，通用模型如GPT-4、Claude 3和Gemini虽然在广泛任务上表现出色，但在专业领域如医疗、金融和法律等场景中，往往难以达到专业人员的期待精度。2025年的研究表明，领域特定的预训练模型在垂直领域任务中能够显著超越通用模型，为专业应用提供更可靠的支持。本文将深入剖析BioBERT、FinBERT等代表性领域模型的技术原理、训练方法、性能评估及实际应用案例，探讨垂直领域预训练的独特优势与未来发展趋势。

aliyun9170107523-43660

369 0 0

灵杰开发者

|

10月前

|

人工智能自然语言处理搜索推荐

阿里云 AI 搜索开放平台集成 DeepSeek 模型

阿里云 AI 搜索开放平台最新上线 DeepSeek -R1系列模型。

灵杰开发者

483 2 2

No8g攻城狮

|

安全 Linux 网络安全

【工具使用】几款优秀的SSH连接客户端软件工具推荐FinalShell、Xshell、MobaXterm、OpenSSH、PUTTY、Terminus、mRemoteNG、Terminals等

【工具使用】几款优秀的SSH连接客户端软件工具推荐FinalShell、Xshell、MobaXterm、OpenSSH、PUTTY、Terminus、mRemoteNG、Terminals等

No8g攻城狮

126760 0 4

探索云世界

|

11月前

|

存储编解码数据处理

云端问道第4期实践教学——多媒体数据存储与分发方案部署演示

该文档详细介绍了阿里云一键部署和手动部署多媒体数据存储与分发方案的步骤。一键部署通过资源编排服务（ROS）实现自动化，涵盖注册账号、开通服务、创建OSS Bucket、配置CDN加速及绑定IMM等功能，简化了复杂操作。手动部署则更细致地展示了每个配置环节，包括网络规划、资源创建、域名绑定、CDN配置、证书加密及最终的验证与清理，确保用户对整个流程有清晰理解。两种方式均以OSS为核心，支持数据上传、转码处理和加速分发，保障高效稳定的用户体验。

探索云世界

452 4 4

Deephub

|

机器学习/深度学习监控数据挖掘

数据并非都是正态分布：三种常见的统计分布及其应用

这篇文章除了介绍线性模型在减肥app预测中的不切实际性，还探讨了不同统计分布在体重管理和数据分析中的应用。文章提到了正态分布和泊松分布，前者常用于描述围绕平均值对称分布的连续数据，如体重；后者适合计数数据，如体重变化次数。正态分布以其钟形曲线闻名，泊松分布则描述独立事件的数量。文章还简要介绍了卡方分布在检验分类变量关系时的作用。最后，文章指出了在线性回归中假设数据正态分布的原因，包括便于统计推断和最小化估计误差。

Deephub

1504 5 5

ZOMI酱

|

机器学习/深度学习缓存芯片

【AI系统】谷歌 TPU v1-脉动阵列

本文详细分析了谷歌TPU v1的架构与设计，重点介绍了其核心组件如DDR3 DRAM、矩阵乘法单元（MXU）、累加器及控制指令单元，特别是MXU中脉动阵列的工作机制。通过对比TPU v1与CPU、GPU在服务器环境中的表现，展示了TPU v1在提升神经网络计算吞吐量方面的显著优势，尤其是在低延迟和高能效方面。

ZOMI酱

515 3 3

暮-夜染

|

存储固态存储算法

OS—磁盘和固态硬盘

OS—磁盘和固态硬盘

暮-夜染

358 0 0

郑小健

|

机器学习/深度学习 PyTorch 算法框架/工具

自定义 DataLoader 设计：满足特定需求的实现方案

【8月更文第29天】在深度学习中，数据加载和预处理是训练模型前的重要步骤。PyTorch 提供了 `DataLoader` 类来帮助用户高效地从数据集中加载数据。然而，在某些情况下，标准的 `DataLoader` 无法满足特定的需求，例如处理非结构化数据、进行复杂的预处理操作或是支持特定的数据格式等。这时就需要我们根据自己的需求来自定义 DataLoader。

郑小健

331 1 1

ModelScope模型即服务

热门文章

最新文章

Meta SAM3开源：让图像分割，听懂你的话

AgentEvolver：让智能体系统学会「自我进化」

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

腾讯混元 HunyuanVideo 1.5 开源！

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

中文大模型体验

阿里云通义千问向全社会开放！

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

Gemini 3 Nano Banana 的MCP服务器开发设计和国内直连方案

StackOverflow已经死亡了吗

NeurlPS 2025！多伦多大学TIRE助力3D/4D 生成精准保留主体身份

贝聿铭的 “数字续作”：蚂蚁百宝箱 × 苏州博物馆，用 AI 重构文化地标

字节推出VeAgentBench + veADK，打造可评估、可复现的智能体开发新范式

杭州AI开源生态大会·魔搭社区开发者嘉年华全回顾

混元OCR模型宣布开源，参数仅1B，多项核心能力SOTA

新的LLM交互模式！大模型终于能自己生成交互式 UI 了

腾讯混元 HunyuanVideo 1.5 开源！

AgentEvolver：让智能体系统学会「自我进化」

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云负载均衡收费标准：ALB、NLB和CLB价格，包括LCU费用、实例费和公网带宽价格