机器之心报道
作者:蛋酱
在 5 月 31 日开幕的 2022 北京智源大会上,智源研究院正式发布了当前生物精度最高的仿真秀丽线虫天宝 1.0(MetaWorm),其单个精细神经元所表征的计算复杂度可类比 5-8 层 DNN,揭示了生物智能所蕴涵的巨大潜力。
上世纪 50 年代,科学家艾伦 · 图灵曾大胆预言:人类会创造出具有真正智能的机器。但经过 60 余年的发展,即使到了今天,以深度学习技术为代表的第三代人工智能可以说尚未触及智能的本质。其通用智能水平远不及斑马鱼、苍蝇等小型生物,功耗更有云泥之别。
生物脑是智能之源。在向下一代人工智能迈进的过程中,脑启发下的众多研究被寄予厚望,其中「全脑仿真」的假设获得的关注度很高:我们是否能够完全模拟人类的大脑,以代替逐渐接近极限的经典计算机?
人们坚定地相信,「全脑仿真」的概念不会止步于科幻小说的情节。但一直以来,全脑仿真的可行性都是一个公认的难题,实现这个目标具备相当的不确定性——因为人脑足够复杂。
相比之下,自然界某些其他生物的大脑要小得多:选择秀丽隐杆线虫作为通过生物神经机理模拟实现通用人工智能的最小载体,提供了一种惊艳的思路。
秀丽隐杆线虫的结构再简单不过:它的体长仅有 1mm 左右,共有 1090 个体细胞,其中 302 个为神经元细胞。这种目前研究的最为透彻的模式动物能够完成感知、逃逸、觅食、交配等一系列智能行为,是今天的人工智能系统难以比拟的。因此,大量课题将秀丽隐杆线虫作为研究动物使用,围绕其进行的一些工作曾在 2002、2006、2008 年三次斩获诺贝尔奖。
秀丽隐杆线虫(Caenorhabditis elegans,C. elegans)。
早在 1980 年代,科学家们就发现了秀丽隐杆线虫神经元之间的连接关系。从 21 世纪初期开始,关于在数字空间内重构「数字孪生线虫」的研究开始出现,但包括 OpenWorm 和 Nemaload 这两个代表性项目在内的相关研究都未能取得重大进展。迄今,从「生命智能」到「智能生命」的探索,一直在等待新的里程碑式突破。
在今年的北京智源大会上,智源研究院宣布在这一领域取得重要突破,并正式发布了当前生物精度最高的仿真秀丽线虫「天宝 1.0」(MetaWorm)。
在这项工作中,天演团队实现了仿真秀丽线虫与仿真环境的全闭环模拟,训练出由高精度神经系统控制的、与环境实时交互的秀丽线虫,能够像真实线虫一样嗅探并控制身体蠕动到感兴趣的目标,对生物神经科学与人工智能前沿探索领域具有重大意义。
单个生物神经元表征能力类比 5-8 层 DNN
从普遍的国际前沿精细化模拟工作来看,细胞和亚细胞是当前的最小研究单元,而「天宝 1.0」的优势在于在细胞和亚细胞级别上实现了高精度模拟。
天演团队完成了秀丽线虫全部 302 个神经元及连接关系的精细建模,神经元的结构模拟采用多舱室模型,单神经元舱室最多达到 2313 个,神经元生理模拟支持 14 种离子通道,是目前已知最高精度的线虫神经系统。
同时,天演团队对 106 个神经元组成的嗅觉和运动神经环路完成了高精度建模,基本还原了感觉神经元、中间神经元、指令神经元、头部运动神经元、身体运动神经元这五类神经元的电生理动力学,更全面地表征了线虫智能。
因此,目前「天宝 1.0」已经初步表现出了类生物线虫的趋利避害能力,它可以嗅探、蠕动前行:
最具价值的是,「天宝 1.0」的诞生揭示了生物智能蕴涵的巨大潜力。此前,一项研究对单个生物神经元的计算复杂度进行了探索,结论显示,一个深度神经网络需要 5 到 8 层互联神经元才能表征单个生物神经元的复杂度。在大多数现有的网络中,这意味着 1 个生物神经元能够对应 1000 个人工神经元。
在「天宝 1.0」模型的搭建中,天演团队使用了与该研究一致的模拟核心计算。也就是说,「天宝 1.0」所模拟级别的单个精细神经元所表征的计算复杂度可类比 5-8 层 DNN。
更适合线虫智能训练的流体仿真环境
这样一条高精度的智能线虫,是如何打造的呢?
大多数线虫生活在海洋、淡水或土壤里,如果要打造一条「数字孪生线虫」,必须搭建起最接近生物真实生存环境的流体仿真环境。
经过深入思考之后,天演团队结合计算神经学、运动力学、图形学等多学科交叉,为智能线虫「天宝」构造了逼真的线虫肌肉和身体软体模型,建立了更适合人工智能体训练的流体仿真环境,具体来说,这个环境框架由包含三维建模、有限元求解、简化流体模型、强化学习、可视化等多个模块。
通过高效的有限元建模,天演团队构建了由具有解剖学意义的 96 块肌肉控制、3341 个力学计算单元构成的秀丽线虫身体,以及适合线虫智能训练的三维流体动态实时仿真环境。同时,团队突破精细神经元系统与肌肉动力学结合的关键技术,展示了智能线虫在水流仿真环境动态蠕动前行的初级智能行为。
天演项目负责人、智源生命模拟中心负责人马雷介绍说,本次天演团队所构建的大规模线虫仿真环境,场景尺度超过 1300 个线虫身长,可支持更大空间和多线虫群体仿真。
「天宝 1.0」模型能够高效、精准地计算与流体环境相互作用的规律。在相同计算资源下,单线虫单次仿真和可视化迭代时间快于 0.1 秒,计算效率超过 OpenWorm 仿真方案。仿真环境规模也超过 OpenWorm 的方案,更适合作为智能体学习训练复杂任务的环境,可满足多线虫复杂任务的学习训练,以加快实现从生命智能到智能生命的可行路径。
意识是生物体具备感觉、认识、思维、推理、想象等综合能力的体现,在现阶段,学术界并不会说智能线虫具备了意识,但生物线虫具有智能已是共识,这也是智能线虫模型的发展目标。下一阶段,天演团队计划实现训练「智能线虫」学习避障、觅食等更复杂的智能任务,探究线虫神经元在处理复杂认知任务时的结构和功能。
未来,天演团队将搭建高精度模拟仿真软硬件系统,实现更多模式动物的数字孪生,同时赋能医药研发与医疗诊断等众多行业。
从生命智能到智能生命的「关键一步」
智源研究院院长黄铁军认为,经典计算机是好用的计算工具,然而并非通用人工智能的终极载体。从脑机理模拟的角度出发,探索生物脑内部的认知过程和范式,才是实现通用智能的根本途径。
一直以来,国际上多家研究机构都在做精细化脑模拟与智能的相关研究,包括欧盟脑计划、欧盟脑计划支持下的 BlueBrain 项目、美国脑计划等,谷歌、Meta 等科技巨头近年来也在持续加码 AI 前沿探索。这次的成果走在了探索的前沿,有望打破领域内长期以来未有实质性突破的现状。
近年来,类脑智能研究也是我国基础科研探索的重点发力方向,仿真秀丽线虫的研究思路和建设方向属前瞻性布局,特别是在生物神经系统精细刻画上具有明显引领作用。「高精度地逼近生物本身,就是科研的目的所在。」黄铁军表示。
精度最高「智能线虫」的诞生,也许只是生命智能迈出的一小步,却代表了计算机中一种智能生命的诞生,迈出了人工智能生命演变的关键一步。
黄铁军表示,从模式动物来看,再小的生物神经网络也具备较为通用的生命智能,但一般意义上的通用人工智能是和人类本身相比的,所以实现真正的通用人工智能,目前还是一个长远目标。
「我们希望通过模拟尽可能真实的生物大脑,重复实现智能的自然选择过程。通过不断提升模拟规模,创造出决策逻辑像人类、思考速度如光电的超级智能。」
以最简单的智能生命体线虫为突破口,天演团队将坚定走生物机理模拟研究路线,继续完善高精度生命模拟仿真平台,持续实现模式动物和重要生物器官的精细模拟,构建生命智能模型并挖掘生物智能机制机理,启发和探索新一代人工智能,从果蝇、斑马鱼、小鼠直至最高智慧的人类大脑。「这条路径要走多少年,现在还是未知的,但我们很乐观,这条路径已经表现出了强大的潜力和可能性。」
成立三年多以来,智源研究院始终聚焦原始创新和核心技术,在北京建成全球最佳的人工智能创新生态,打造世界人工智能的「学术高地」。此外,2022 北京智源大会的开幕式还公布了更多工作进展:
悟道大模型在众多应用领域持续落地生根。据智源研究院介绍,继 OPPO、好未来、淘宝、搜狗之后,智源悟道大模型在美团 APP 落地。经过对比实验,在搜索广告、智能助理、评价标签三大应用场景上带来明显改善,其中在搜索广告上带来 2.7% 的收入增长。
同时,新一代科研智算平台「九鼎智算平台」也在这次北京智源大会上正式发布。基于当前通用大模型、AI for Science 等科研趋势衍生的需求,九鼎智算平台提供了 AI+HPC 融合的云计算体系机构,希望能够打造 AI 科研创新与应用的试验场,成为未来十年人工智能发展的强大基座。在这次智源大会上,由智源研究院牵头、多家 AI 芯片企业共同参与的「共建 AI 芯片生态实验室」也正式成立。