当AI遇上量子化学,这是NeurIPS 2022挑战赛的冠军解决方案

简介: 当AI遇上量子化学,这是NeurIPS 2022挑战赛的冠军解决方案


在刚刚落幕的由 Meta AI 研究院及卡耐基梅隆大学(CMU)联合机器学习顶级会议 NeurIPS 共同举办的第二届 Open Catalyst Challenge (OCP)竞赛中,由腾讯 AI Lab 领头,中国人民大学,清华大学以及香港中文大学组成的联合团队 TTRC 以 0.396eV 绝对误差的成绩获得第一,相对于去年的最好成绩,提升达到 27.6%。


一、背景


Open Catalyst Project (OCP)是由 Meta AI 和卡耐基梅隆大学联合发起的一个科研项目,旨在使用人工智能算法加速可用于再生能源存储的催化剂的发现。其核心目的是通过寻找高效且经济的催化剂来解决再生能源存储的问题。


在这一领域,传统方法是基于量子力学(密度泛函理论 DFT)的模拟计算催化剂表面和目标吸附物的结合能来测试和评估新的催化剂结构。然而,这类模拟的一大缺点是其巨大的计算成本,通常单个组合模拟就需要耗费 24 小时以上。这使得我们无法高效且大量地筛选潜在的催化剂结构。因此,如何利用机器学习算法去建模量子化学模型进而实现对于催化剂结构的有效筛选还是一个非常具有前景的方向。


传统基于量子力学的计算流程(引自官方资料)


给定一个催化剂 - 吸附物组成的反应系统,经典的量子力学模拟计算分为两个步骤,第一步是基于密度泛函理论计算系统中微观粒子的等效受力。第二步则是基于这个受力迭代更新系统中原子核的位置。直到受力收敛。这样就可以得到这个系统低能态,即松弛状态,进而计算催化剂和吸附物的结合能。


本次比赛参赛主题则是构造机器学习模型预测一个由催化剂 - 吸附物组成的反应系统的松弛状态能量,即 IS2RE(Initial state to relaxed energy)。同上一届不同的是,除了提供催化剂 - 吸附物以及对应能量标签(46 万)外,主办方还额外提供了 200 万的由密度泛函计算得到的静态反应系统的坐标及其对应的力和能量。基于这些数据,模型可以去预测静态结构下的等效受力,即 S2EF(Structure to energy and force),使得模型可以更好探索量子力学计算的部分建模。


二、技术


自从 OCP 项目发起以来,由于其重要的科学意义和庞大的数据规模以及具有挑战的任务,吸引了 DeepMind,MSRA,达摩院,MILA,MIT,上海交大等机构的关注和参与。在今年的第二届比赛中,我们提出的 GeoEnsemble 框架以 0.396eV 绝对误差的成绩获得第一,相对于去年比赛最好成绩 Graphormer,提升达到 27.6%。


非公开测试集排行榜,带下划线的为官方 Baseline。(引自官方资料)


本届比赛的方案相对于上一届方案的提升。(引自官方资料)


限定比赛用训练集的方法,在 Public Leaderboard 性能表现。

数据来源: https://eval.ai/web/challenges/challenge-page/712/leaderboard/1950


在 GeoEnsemble 框架中,为了对原子之间复杂的动态交互关系进行建模,我们在 ICLR 2022 发表的图动力学神经网络(GMN)[1]的基础上进行了改进,提出了 GMN-OC 模型。


GMN-OC 模型的输入是一个由原子构成的几何图,几何图中包含了几何特征(原子的三维坐标)和非几何特征(原子的类型),模型可以预测输出几何向量(原子的受力)和非几何标量(系统能量)。


GMN-OC 整体输入和输出流程


在 GMN-OC 模型中,我们构造了一个基于多通道的几何特征 O(3)等变函数 与不变函数 用来处理几何特征和非几何特征的交互。


基于这两个函数,我们构建了一个基于消息传递的图神经网络,在 GMN-OC 的每一个网络层中,会基于 O(3)等变与不变函数进行消息传递与聚合,从而实现对每个原子的几何特征和非几何特征进行更新。


基于消息传播的几何特征更新过程


在这个基础模型上,我们进一步引入了一个全局共享表示模块(Global Representation Module)建模在 DFT 计算中可能涉及到的粒子之间的全局交互信息。同时也保持了模型的等变性。


全局共享表示模块示意图


整个 GMN-OC 模型结构如下图。同时,我们在计算时,使用了 Multi-head 的显存优化方法,使得模型可以更好的应对大数据的处理。


GMN-OC 模型整体架构


此外在训练技术上,为了充分利用赛事提供的两组训练数据,我们使用了 Pretrain-Finetune、Multi-task Learning 等优化技术,进一步提高模型预测精度。此外,我们结合 GMN-OC/SCN/GemNet 等多个模型,构建了多模型融合方案 GeoEnsemble。为了提高模型训练速度,我们还使用了混合精度训练等技术,并在大规模集群上完成了分布式训练。

 

GeoEnsemble 在训练上的改进


三、展望


利用人工智能技术助力自然科学领域中的探索和发现,已经成为近年来人工智能领域备受瞩目的应用方向之一。得益于高性能计算能力和前沿人工智能技术的不断发展,基础科学领域的研究者得以利用人工智能算法去加速相关领域中复杂、大规模的计算和模拟任务,如蛋白质折叠、小分子结合能计算、催化剂发现等。


腾讯 AI Lab,基于在人工智能算法研究中的积累,在生命科学,物理建模等多个应用方向上取得了重要的突破。例如首个大规模小分子预训练模型 GROVER [2]及骨架跃迁生成模型 [3],自研蛋白质折叠模型 tFold [3] 和基于序列预训练的抗体结构预测模型 tFold-Ab [4],基于等变性的蛋白质对接模型 EquiDock [5],基于图动力学网络的蛋白质动态结构预测模型 EGHN [6]等。同时,腾讯云深 AI 药物发现平台研发的基于等变图神经网络的分子能量框架 DeepQC,可以实现对类药分子的高精度的量化计算。


我们将在近期开源这次比赛使用的模型和训练推理源码,以助力人工智能在量子化学模拟和电子结构计算等基础研究领域的应用。在未来,腾讯 AI Lab 将持续研发和落地 AI 新技术,推动 AI 在交叉学科中的新应用,探索 AI 赋能科学发现的新范式。


比赛链接:https://opencatalystproject.org/challenge.html

项目主页:https://ai.tencent.com/ailab/ml/ocp/index.html


引用:

1. Equivariant Graph Mechanics Networks with Constraints

2. Self-Supervised Graph Transformer on Large-Scale Molecular Data

3. A novel scalarized scaffold hopping algorithm with graph-based variational autoencoder for discovery of JAK1 inhibitors

4. When homologous sequences meet structural decoys: Accurate contact prediction by tFold in CASP14—(tFold for CASP14 contact prediction)

5. tFold-Ab: Fast and Accurate Antibody Structure Prediction without Sequence Homologs

6. Independent SE(3)-Equivariant Models for End-to-End Rigid Protein Docking

7. Equivariant Graph Hierarchy-Based Neural Networks


相关文章
|
17天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
75 2
|
27天前
|
数据采集 人工智能 监控
体验《AI大模型助力客户对话分析》解决方案测评
该方案详细描述了实现AI客服对话分析的实践原理和实施方法,包括数据收集、模型训练、部署及评估等步骤,逻辑清晰。但在OSS配置和模型选择等方面存在一些困惑,需进一步引导。示例代码大部分可直接应用,但特定环境下需调整。总体而言,方案基本能满足实际业务需求,但在处理复杂对话时需进一步优化。
46 6
|
1月前
|
机器学习/深度学习 数据采集 人工智能
文档智能 & RAG 让AI大模型更懂业务 —— 阿里云LLM知识库解决方案评测
随着数字化转型的深入,企业对文档管理和知识提取的需求日益增长。阿里云推出的文档智能 & RAG(Retrieval-Augmented Generation)解决方案,通过高效的内容清洗、向量化处理、精准的问答召回和灵活的Prompt设计,帮助企业构建强大的LLM知识库,显著提升企业级文档管理的效率和准确性。
|
1月前
|
数据采集 机器学习/深度学习 人工智能
《AI大模型助力客户对话分析》解决方案测评
本文对《AI大模型助力客户对话分析》解决方案进行了测评,详细介绍了实践原理和实施方法的清晰度、部署过程中的困惑、示例代码的适用性和异常处理以及业务场景的适用性和改进建议。方案整体实用性强,但在数据预处理、术语解释和行业特定模型训练方面有进一步提升的空间。
|
6天前
|
机器学习/深度学习 人工智能 监控
智慧交通AI算法解决方案
智慧交通AI算法方案针对交通拥堵、违法取证难等问题,通过AI技术实现交通管理的智能化。平台层整合多种AI能力,提供实时监控、违法识别等功能;展现层与应用层则通过一张图、路口态势研判等工具,提升交通管理效率。方案优势包括先进的算法、系统集成性和数据融合性,应用场景涵盖车辆检测、道路环境检测和道路行人检测等。
|
9天前
|
人工智能 自然语言处理 关系型数据库
从数据到智能,一站式带你了解 Data+AI 精选解决方案、特惠权益
从 Data+AI 精选解决方案、特惠权益等,一站式带你了解阿里云瑶池数据库经典的AI产品服务与实践。
|
23天前
|
存储 人工智能 弹性计算
基于《文档智能 & RAG让AI大模型更懂业务》解决方案实践体验后的想法
通过实践《文档智能 & RAG让AI大模型更懂业务》实验,掌握了构建强大LLM知识库的方法,处理企业级文档问答需求。部署文档和引导充分,但需增加资源选型指导。文档智能与RAG结合提升了文档利用效率,但在答案质量和内容精确度上有提升空间。解决方案适用于法律文档查阅、技术支持等场景,但需加强数据安全和隐私保护。建议增加基于容量需求的资源配置指导。
85 4
|
24天前
|
人工智能 弹性计算 监控
触手可及,函数计算玩转 AI 大模型解决方案
阿里云推出的“触手可及,函数计算玩转 AI 大模型”解决方案,利用无服务器架构,实现AI大模型的高效部署和弹性伸缩。本文从实践原理、部署体验、优势展现及应用场景等方面全面评估该方案,指出其在快速部署、成本优化和运维简化方面的显著优势,同时也提出在性能监控、资源管理和安全性等方面的改进建议。
55 5
|
24天前
|
人工智能 数据安全/隐私保护 UED
RAG让AI大模型更懂业务解决方案部署使用体验
根据指导文档,部署过程得到了详细步骤说明的支持,包括环境配置、依赖安装及代码示例,确保了部署顺利进行。建议优化知识库问题汇总,增加部署失败案例参考,以提升用户体验。整体解决方案阅读与部署体验良好,有助于大型语言模型在特定业务场景的应用,未来可加强行业适应性和用户隐私保护。
62 5
|
22天前
|
人工智能 分布式计算 数据可视化
大模型私有化部署全攻略:硬件需求、数据隐私、可解释性与维护成本挑战及解决方案详解,附示例代码助你轻松实现企业内部AI应用
【10月更文挑战第23天】随着人工智能技术的发展,企业越来越关注大模型的私有化部署。本文详细探讨了硬件资源需求、数据隐私保护、模型可解释性、模型更新和维护等方面的挑战及解决方案,并提供了示例代码,帮助企业高效、安全地实现大模型的内部部署。
47 1

热门文章

最新文章