于云栖处,探索 AI+Science 的大规模工程化

简介: 在语音识别、图片搜索和数据处理等功能遍布于个人设备,将人们从繁琐、机械的工作中解放出来的同时,在科学领域,AI正在蓄力等待一个深入渗透进生物、化学、物理、工程等基础科学领域的契机。

image.png

在语音识别、图片搜索和数据处理等功能遍布于个人设备,将人们从繁琐、机械的工作中解放出来的同时,在科学领域,AI正在蓄力等待一个深入渗透进生物、化学、物理、工程等基础科学领域的契机。


AI被人们赋予厚望,重塑科学研究范式与科研协同方式,并以前所未有的方式推动人类认知边界的拓展。因此,AI+Science 成为当下探索科技创新、寻找前沿驱动的新思潮。


10月19日,在2021云栖大会首日上午的主论坛上,深势科技创始人及首席科学家张林峰发表了以“‘AI+Science’:从科学愿景走向大规模工程化”为题的的主题演讲,系统性地介绍了“AI+Science”从科学研究的范式转变到对应场景的具体落地的发展历程与实现路径。


image.png




01 AI+Science

连接不同物理尺度的桥与门


AI和Science,都是非常热的词。做AI的人们在过去的几年里完成了CV、征服了NLP,并雄心勃勃地思考哪里是下一个战场;而在基础学科做Science的研究者们,坚持恪守着自己的诗和远方,却时常受到于研究手段的限制,难以展开创造和想象力的释放。当这两者相融合,将会碰撞出怎样的火花?


长期以来,我们认识世界和解决问题的思路遵循着两大范式——开普勒范式和牛顿范式。前者从数据中提取规律,后者寻求基本原理。AI的现有应用场景在两种范式中也有对应:在CV、NLP等领域的应用是集前者之大成,而当代仿真模拟和工业设计软件则是后者的精华沉淀。


两种范式因其自身特点而各受限制,开普勒范式下的模型存在可解释性、可迁移性不高的问题;而牛顿范式下的模型则要求棘手又漫长的计算过程,即所谓“维度灾难”。


在精确程度和计算速度两难全的困局下,AI+Science 带来了两种范式结合的可能性。


AI+Science 意味着AI的复杂数据处理能力和Science的第一性原理的结合,本质上,是两种传统研究范式的结合。


image.png


从微观到宏观不同尺度的不同物理模型,对应科学研究关注的不同问题。薛定谔方程精准地描述了电子、原子的运动,由此延展,世间万物的全部奥秘都可以从微观的层面探寻解答。


AI赋予人们的,恰恰是高维复杂函数的表示能力。我们可以运用AI求解不同尺度上的有效理论对应的物理方程,物理模型的演绎能力又能为我们产生更多数据,用微观的求解去训练更宏观的模型,层层递进,最终获得兼具微观尺度的精度和宏观尺度的效率。


image.png

用AI连接各尺度物理模型


AI+Science 的系统性机会由此产生,通过AI连接起不同尺度,把第一性原理的精度不断推向宏观世界,打开通向全新的科学研究范式和落地应用场景之门。


以AI和分子动力学模型结合的 DeePMD(Deep Potential Molecular Dynamics)为例,在Deep Potential方法有效学习了通过量子力学求解得到的原子模型后,可以极大地加速整个体系的模拟速度,实现对数亿原子体系的模拟。通过Deep potential工具,一项在超级计算机上需要2亿核时的计算,可以在个人笔记本电脑上在一小时内完成复现。这项目工作在去年获得了高性能领域的最高奖戈登·贝尔奖(ACM Gordon Bell Prize)。


image.png

Deep Potential相关工作获得2020戈登·贝尔奖


基于DeePMD开源软件,来自世界各地的数千个材料、化学、生物等领域的研究组正在拓宽着他们的科研边界,也产生了很多优质的科研成果。这仅是 AI+Science 在微观领域中的一次实践,实际上的应用场景远不止于此,从微观的化工、材料、药物到宏观的飞机、汽车、火箭,都将有AI+Science丰富而广阔的应用机会。


image.png

AI+Science广阔的应用场景



02 AI+Science

大规模工程化正当时


在拥有高速发展的算力、精进迭代的算法之后,AI+Science 的大规模深入应用,面临着一个系统工程化的需求。可以从三个维度理解。


image.png


首先是规模工程,便捷的云服务已经逐渐成为了基础设施,过去规模化的云服务主要面向购物、峰值支付等普通生活需求,中间架构更多是微服务的架构。而科学计算对它有巨大的需求,同时有着大规模并行、大规模并发离线计算以及多种计算资源混用调用等一系列新特点,这些新特点需要有好的架构支持和优秀的中间调度工具,规模工程要更加面向计算本身


第二是数据工程,在很多AI应用领域,我们从最开始的基本数据积累逐渐到大数据、衍生出的大模型,然后基于这些 Pretrain 模型进行优化、压缩、做迁移等等。而 AI+Science 也可以做现在很火的大模型,玩模型迁移、模型压缩等,但它将需要面向物理,尊重物理约束


最后是性能工程。过去也有不同尺度上的物理模型计算软件,发展至今经历了一系列的适配和优化的工作,改进的仅仅是面向不同类型硬件平台做出的定制化优化。而 AI+Science 召唤的是根据不同的计算类型去生产定制化硬件,科学计算的种种基础设施在当下或许已显老旧,积累了几十年,可能已经没有人愿意去清理、迭代了,而这个时候我们需要把它重新的翻个底朝天,因为未来的性能工程将不再是软件对硬件的适配,而会是硬件对算法的定制。未来的 AI+Science 性能工程,将会是面向算法的!


重构基础设施的工作需要系统化努力,因此, AI+Science 工程化需要的是科学家、工程师以及各行各业的协同作战。


因此,我们发起了Deep Modeling 开源社区,希望能够协同不同领域的科学家、工程师以及各行各业的用户,以平等开放的交流方式和同行评审的协作机制,重构知识体系和协同方式,共同打造 AI+Science 的新一代的基础设施。


image.png

经由DeepModeling,从算力封装到行业应用


在我们所推动的 DeepModeling 开源社区之上,新一代的 AI+Science 大厦正在被建立:底层算力调度、各尺度物理引擎、数据库、面向各类计算需求的工作流等等,系统性地实现不同领域对计算的需求。



03 AI+Science

栖于云上的未来愿景


那么AI+Science的未来是什么?


我的答案是解放科学研究与工业设计的生产力。在 AI+Science 的愿景之中,科学家们将有更好的研究工具去探索、聚焦他们关注的问题;面向不同场景的需求,我们会有更好的工业设计的工具。


image.png

深势科技微尺度工业设计平台体系


基于 AI+Science 的全新研究范式,我所在的深势科技正聚焦微观的尺度,计划在未来5年打造微尺度工业设计平台,希望科学计算的平台能解放科学家、解放科技生产力,更希望我们的药物设计和材料设计的平台能够切实赋能于这两个大的行业。


最后,作为一个科学家,我也希望回归诗和远方。引用荷尔德林的一句诗来结束:“充满劳绩,但人类诗意地栖居在这片土地上。”同时我相信,充满挑战,但AI+Science终将原生地栖居在这片云上。


image.png


期待我们共同的努力,谢谢大家!

目录
打赏
0
0
0
0
12371
分享
相关文章
从大规模恶意攻击 DeepSeek 事件看 AI 创新隐忧:安全可观测体系建设刻不容缓
唯有通过全行业的协同努力,加强整体、完善的网络安全可观测建设,才能为 AI 技术的创新和发展构建一个安全而稳固的环境。我们期盼并相信,在攻克这些网络安全难题之后,AI 创新将迎来更加安全、灿烂的未来。
从大规模恶意攻击 DeepSeek 事件看 AI 创新隐忧:安全可观测体系建设刻不容缓
从大规模恶意攻击 DeepSeek 事件看 AI 创新隐忧:安全可观测体系建设刻不容缓
从大规模恶意攻击 DeepSeek 事件看 AI 创新隐忧:安全可观测体系建设刻不容缓
从大规模恶意攻击 DeepSeek 事件看 AI 创新隐忧:安全可观测体系建设刻不容缓
从大规模恶意攻击 DeepSeek 事件看 AI 创新隐忧:安全可观测体系建设刻不容缓
在近来发生的 DeepSeek 遭遇的安全事件中,我们可以看到当前人工智能行业在网络安全方面的脆弱性,同时也为业界敲响了警钟。唯有通过全行业的协同努力,加强整体、完善的网络安全可观测建设,才能为 AI 技术的创新和发展构建一个安全而稳固的环境。我们期盼并相信,在攻克这些网络安全难题之后,AI 创新将迎来更加安全、灿烂的未来。
227 16
斯坦福伯克利重磅发现DNA Scaling Law,Evo荣登Science封面!AI设计DNA/RNA/蛋白质再突破
近日,斯坦福大学和加州大学伯克利分校在《科学》杂志发表重要成果,发现DNA Scaling Law规律,揭示了DNA、RNA和蛋白质分子长度与碱基对数量之间的比例关系。该研究为AI设计生物分子带来突破,通过数据收集、模型训练和优化设计等步骤,显著提高设计效率和准确性,降低成本,并拓展应用范围。论文地址:https://www.science.org/doi/10.1126/science.ado9336。
97 26
AI 应用工程化专场
本次分享的主题是AI 应用工程化专场,由Spring AI Alibaba 开源项目负责人刘军分享。 1. 初识 Spring AI Alibaba开源项目 2. Spring AI Alibaba 深入讲解 3. Spring AI Alibaba RAG 开发实践 4. Spring AI Allbaba 未来规划 5. 数据 6. 问答
153 1
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
阿里云瑶池在2024云栖大会上重磅发布由Data+AI驱动的多模数据管理平台DMS:OneMeta+OneOps,通过统一、开放、多模的元数据服务实现跨环境、跨引擎、跨实例的统一治理,可支持高达40+种数据源,实现自建、他云数据源的无缝对接,助力业务决策效率提升10倍。
【云栖实录】大模型驱动,开源融合的AI搜索产品发布
本文介绍了2024云栖大会上,阿里云发布的年度AI搜索产品详情。
395 8
云栖实录 | GenAI 时代 AI Infra 工程技术趋势与平台演进
本文根据2024云栖大会实录整理而成,演讲信息如下: 演讲人:林伟 | 阿里云智能集团研究员、阿里云人工智能平台 PAI 负责人;黄博远|阿里云智能集团资深产品专家、阿里云人工智能平台 PAI 产品负责人 活动:2024 云栖大会 - AI Infra 核心技术专场、人工智能平台 PAI 年度发布专场