科学家们终于可以对“科学本身”做实验了。
- 想验证一个社会理论,如何快速找到上万名志愿者调研?
- 想缩短长达数年的研究周期,如何让社会“加速演化”?
- 面对无法设置“对照组”的困境,如何证明因果,而非源于推测?
这些“科学学”中的经典问题,因无法在现实世界设置“对照组”,长期停留在观察与猜想阶段。
为了解决这些难题,通义实验室联合中国人民大学,利用 AgentScope 共同构建了由数万名 AI 科学家组成的虚拟学术宇宙 CiteAgent。
这项研究成果已经被社会科学跨学科领域排名第一的 Nature 旗下期刊《Humanities & Social Sciences Communications》录用,本文将带你读懂这项用 AI 模拟学术世界的顶刊研究,并揭秘支撑大规模仿真的核心技术——多智能体框架 AgentScope。(公众号后台回复CiteAgent获取原论文)。
要回答那些根本性的问题,我们首先需要一个“沙盒”。为此,研究团队基于通义自研的 AgentScope 框架,设计并实现了 CiteAgent 系统。
CiteAgent 框架核心流程图
该工作将问卷调研和对照实验等社会学经典方法融入 LLM 智能体仿真,提出了 LLM-SE(大模型问卷调查)与 LLM-LE(大模型控制实验)两大新型研究范式。
依托上万个智能体的协同运行,成功复现了引文网络中的三大经典现象:幂律分布(Power-law Distribution)——少数论文垄断引用;引文扭曲(Citational Distortion)——核心国家论文被多引;直径收缩(Shrinking Diameter)——学术圈日益紧密。
通过在仿真中对 LLM 智能体的观察,论文给出这些现象可能的科学解释,例如,幂律分布源于个体对高被引文献的自主偏好;引文扭曲并非源于主观偏见,而是由作者数量不均驱动的结构性累积优势;直径收缩是新论文不断连接孤立知识节点的演化结果。这一系列可验证、可复现的模拟,让社会科学拥有了自己的“实验室”。
支撑 CiteAgent 驱动数万 AI 学者并行思考、协作与引用的,是通义实验室自研的多智能体框架——AgentScope。该框架针对多智能体并发效率、分布式部署能力、和接口设计等特性的优化,使其有能力支持大量智能体在同一沙盒环境中进行协作,为复杂社会系统的模拟提供了关键技术支撑。
高并发智能体调度
AgentScope 的核心引擎基于经典的 Actor 并发计算模型。在此架构下,CiteAgent 中的每一位 AI 学者都作为一个独立的 Actor 运行,拥有私有状态,并通过异步消息进行自主交互。
这种“去中心化”的设计,使 AgentScope 能自动识别仿真流程中固有的并行潜力。当一位学者在检索文献时,成千上万的学者可同时进行写作或讨论,将传统需要数周的仿真任务大幅缩短。
高并发智能体调度的可视化
一键扩展的部署能力
为了应对单机难以处理的大规模仿真需求,AgentScope 提供了无缝的服务化分布式部署能力。研究者可以将不同的 AI 学者群体部署为跨节点的独立服务,他们之间的所有互动均由框架底层的高效网络通信接管。
这使仿真可轻松扩展至百万级智能体的规模,CiteAgent 也因此具备了从“小型研讨会”扩展到“全球学术网络”的弹性能力。
一键扩展的部署能力
极简接口让研究更专注
为了让更多非计算机背景的研究者也能使用 AgentScope 进行仿真,AgentScope 提供了用户友好的使用接口,支持研究者以极低的代码改动,将单机应用转化为分布式版本,无需关心底层的并行调度与通信细节。这让社会科学研究者能将其精力完全专注于仿真逻辑与实验设计这些创造性工作上。
基于 AgentScope 的上述特性,研究团队得以在有限的时间内完成大规模引文网络仿真,极大缩短研究周期,提高研究效率。
CiteAgent 验证了 AgentScope 框架在赋能基础研究方面的重要价值。在 “AI for Science” 已渐入佳境之时,“AI for Social Science” 正成为大模型最具潜力的前沿方向。我们期待,基于 LLM 智能体的社会模拟,能够帮助研究者更深入地理解人类行为模式,为社会科学研究开辟出一条全新的路径。
微信扫描下方👇二维码 关注阿里云百炼公众号,第一时间了解产品动态信息!