3 月 27 日,据新华社报道,为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委近期启动「人工智能驱动的科学研究」( AI for Science )专项部署工作。
「AI for Science 有可能推动我们在下一轮科技革命中走在前沿。」中科院院士、北京科学智能研究院院长、自然科学基金委「下一代人工智能」重大研究计划专家组组长鄂维南对此作出预判。
新一轮科学革命如何弯道超车?
北京科学智能研究院副院长、深势科技创始人兼首席科学家张林峰认为,人工智能驱动下的科学研究最大的特点是,它以一种前所未有的方式,将不同学科、不同背景的人们连接在一起。「Al for Science 是一个学科与知识体系大重构的过程,既需要计算机、数据科学、材料、化学、生物等学科的交叉融合,也需要数学、物理等基础学科进行更深入的理论构建和算法设计。」张林峰提醒,「当且仅当做好相关的融合,我们才有机会在新一轮科学革命中抢占先机。」
本次,我国布局 AI for Science 前沿科技研发体系,将紧密结合数学、物理、化学、天文等基础学科关键问题,围绕药物研发、基因研究、生物育种、新材料研发等重点领域科研需求展开。对此,中科院自动化研究所所长徐波解释说,新药创制、基因研究、生物育种、新材料研发等领域,是人工智能与科学研究结合需求迫切、进展突出、具有代表性的重要方向。
比如,基于生物学机制、疾病和用药相关数据、药物的各种药学性质等建立的人工智能模型,可预测新药的安全性和有效性;通过人工智能辅助,可减少研发中的人力、物力和时间投入,提高药物研发成功率。当人工智能赋能新材料研发后,可实现将电子尺度和分子尺度等多尺度材料计算模拟方法耦合,快速筛选符合目标性能的新材料成分和构型,压缩新材料与器件研发周期和成本。
AI 新战场:传统科研领域
近年来,人工智能在科研领域被初步应用,越来越多的科学家自研或采用成熟的人工智能算法,辅助进行数据挖掘分析、建模、仿真、预测等科研工作,加快发现自然科学新规律、新模式,减少重复性人力工作,提升科学发现的准确性,显著提高科研人员的工作效率。随着人工智能技术和科学研究的结合愈发紧密,新兴研究领域 AI for Science(人工智能科学研究)出现,并且从 2020 年开始,此新兴领域进入集中爆发阶段。
2021 年 1月,加州大学圣地亚哥分校等机构的研究者提出了一种名为「Multi-fidelity Materials Graph Networks」(多精度材料图网络)的机器学习方法,通过学习来自多种测量和仿真来源的数据,通过 AI 模型预测材料的特性。该方法能够构建出具有普遍意义、更准确的「材料属性模型」,从而帮助科学家筛选有研究前景的候选材料。
多保真度材料图网络处理材料学数据和进行属性建模的方法
2021 年 7 月,DeepMind 发布的 AlphaFold 2,已能成功预测 98.5% 的人类蛋白质三维结构,且预测结果与大部分蛋白质的真实结构只相差一个原子的宽度,可达到以往通过冷冻电子显微镜等复杂实验观察预测的水平。12 月,这项研究被《自然》杂志评为 2021 年度技术突破。
AlphaFold2模型在多种物质上预测结果的置信区间
同样在 2021 年 7 月,华盛顿大学、哈佛大学等的研究者提出蛋白质结构预测算法 RoseTTAFold,该方法基于深度学习,通过在蛋白质序列信息的学习,能够快速生成蛋白质的精确结构,减少传统方法在实验测定等方面投入的时间和精力。目前该算法已开源。
RoseTTAFold 中用于预测蛋白质结构的一系列算法架构
GitHub 地址:
https://github.com/RosettaCommons/RoseTTAFold
2021 年 10 月,DeepMind 在《自然》杂志发表论文,通过与英国气象局合作,将 AI 技术应用于降雨预测。研究者采用深度生成模型,可提前 5-90 分钟预测 1536km×1280km 区域内的降水情况。与其他方法对比,该模型在 89% 的情况下中具有最高的准确度和实用性( Usefulness )。
DeepMind 提出的 AI 模型架构
除了国外取得以上相关领域研究成果之外,国内 AI for Science 的热度同样越来越高。
从政策层面来看,在这次科技部亲自下场扶持之前,2022 年 5 月,国家发展改革委《「十四五」生物经济发展规划》明确把加快发展高通量基因测序技术,作为开展前沿生物技术创新的重要手段;支持采用人工智能等信息技术,实现药物产业的精准化研制,进而通过生物技术与信息技术融合更好惠民。
从人才层面来看,众多 AI 领域的大佬选择投身此领域。本月中旬,CV 领域翘楚何恺明在 MIT 做学术演讲过程中就曾谈到接下来将重点关注 AI for Science,具体将聚焦视觉和 NLP 大一统做 self-supervised X+AI。
从成果层面来看,近日,来自中国科学院深圳先进技术研究院的研究团队首次将数据驱动自动合成( Data driven automated synthesis )、机器人辅助可控合成( Robot assisted controllable synthesis )、机器学习促进逆向设计( Machine learning facilitated inverse design )用于胶体纳米晶(例如钙钛矿)材料合成,探索构建了「机器科学家」平台,有望将科研人员从传统试错实验、劳动密集型表征中解放,聚焦科学创新,实现纳米晶材料数字智造。
机器人辅助胶体纳米晶数字智造自动化平台
2023 年 3 月 2 日,该研究以「A robotic platform for the synthesis of colloidal nanocrystals」为题,发布在《自然-合成》( Nature Synthesis )上。
论文链接:https://www.nature.com/articles/s44160-023-00250-5
AI for Science:机遇与挑战并存
与大家耳熟能详的生成式 AI 不同的是,AI for Science 涉及生物制药、能源、材料研发等科研领域,并不能即刻让大众上手体验相关成果,但其对前沿科研所施加的加速作用,却会对人类社会和经济发展有更为基础和深远的影响。
不过,也需看到,AI for Science 所具备的全面、深层次革新价值,亦让它面临远高于人们常见 AI 应用的落地壁垒。据阿里达摩院 2022 年十大科技趋势报告中显示,人工智能与科研深度结合仍然需要重点解决三方面挑战:
* 人机交互问题,AI 与科学家在科研流程上的协作机制与分工需要更加明确,形成紧密的互动关系;
* AI 的可解释性,科学家需要明确的因果关系来形成科学理论,AI 需要更容易被理解,以建立科学与 AI 之间的信任关系;
* 交叉学科人才,专业领域科学家与 AI 专家的相互理解程度低,彼此互相促进的障碍仍然较高。
值得关注的是,报告中还作出预测,在未来三年内,人工智能技术在应用科学中将得到普遍应用,在部分技术科学中开始成为研究工具。