AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: The AI Scientist-v2 是由 Sakana AI 等机构开发的端到端自主科研系统,通过树搜索算法与视觉语言模型反馈实现科学假设生成、实验执行及论文撰写全流程自动化,其生成论文已通过国际顶会同行评审。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🔬 "科研民工集体失业?AI系统竟能独立完成顶会论文,评审专家直呼离谱!"

大家好,我是蚝油菜花。当科研人员还在为实验设计和论文修改熬夜爆肝时,这个由 Sakana AI 领衔开发的系统正在颠覆传统科研范式!

你是否经历过这些学术至暗时刻:

  • 📊 实验数据反复异常,三个月心血付之东流
  • 📑 论文评审意见要求补充实验,截稿日期迫在眉睫
  • 🔬 跨学科研究需要同时掌握多个领域知识,分身乏术...

今天要拆解的 The AI Scientist-v2 ,用三大突破重塑科研生产力:

  • 全流程自动化:从假设生成到论文撰写,无需人工干预
  • 树状搜索算法:并行探索多实验路径,效率提升300%
  • 视觉语言双反馈:图表质量与文本逻辑AI自检,成果直投顶会

已有团队用它生成ICLR 2025录用论文,接下来将解密这个「科研终结者」的技术原理与部署方法!

🚀 快速阅读

该系统实现了科学研究全流程的自动化闭环。

  1. 核心功能:自主生成假设、设计实验、分析数据、撰写论文
  2. 技术原理:基于代理的树搜索算法优化探索路径,视觉语言模型提供质量反馈

The AI Scientist-v2 是什么

The AI Scientist-v2

该系统通过整合多模态AI技术,构建了完整的科研自动化工作流。其核心突破在于消除对人类预定义模板的依赖,采用自适应的探索策略完成复杂科研任务。

技术架构采用分阶段管理机制,将科研过程拆解为假设生成、实验设计、数据分析等模块。每个模块通过特定代理实现功能,系统通过树搜索算法动态优化执行路径。

The AI Scientist-v2 的主要功能

  • 假设智能生成:基于现有文献自动推导创新研究方向
  • 实验动态规划:根据实时数据调整实验参数与流程
  • 可视化自检:通过VLM评估图表质量并优化呈现方式
  • 论文结构化输出:自动生成符合学术规范的完整论文

The AI Scientist-v2 的技术原理

  • 树状搜索算法:采用广度优先策略并行探索多实验路径
  • 模块化代理系统:实验管理代理协调各阶段任务执行
  • 代码自愈机制:自动调试执行异常代码并记录错误日志
  • 多源数据处理:集成Hugging Face数据集实现快速加载

如何运行 The AI Scientist-v2

1. 安装

conda create -n ai_scientist python=3.11
conda activate ai_scientist
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
conda install anaconda::poppler # 用于 pdftotext
conda install conda-forge::chktex # 用于写入

pip install -r requirements.txt

2. 支持的模型和 API 密钥

OpenAI 模型

默认情况下,使用 OPENAI_API_KEY 环境变量。

Claude 模型(通过 Bedrock)

对于由 Amazon Bedrock 提供的 Claude 模型,请安装以下额外包:

pip install anthropic[bedrock]

接下来,设置一组有效的 AWS 凭证 和目标 AWS 区域,通过设置环境变量 AWS_ACCESS_KEY_IDAWS_SECRET_ACCESS_KEYAWS_REGION_NAME

Semantic Scholar API(文献搜索)

我们的代码还可以选择使用 Semantic Scholar API 密钥(S2_API_KEY)以提高吞吐量(如果你有密钥的话)。如果没有密钥,也可以运行,但可能会影响性能。如果你在使用 Semantic Scholar 时遇到问题,可以跳过文献搜索和引用阶段。

确保为使用的模型提供密钥,例如:

export OPENAI_API_KEY="你的密钥"
export S2_API_KEY="你的密钥"

3. 运行 AI Scientist-v2 论文生成实验

你可以使用命令行参数指定写入和评审阶段的模型。最佳优先树搜索配置可以在 bfts_config.yaml 文件中找到。根据需要进行修改。

相关的树搜索配置参数包括:

  • agent 配置:

    • 设置 num_workersstepssteps 是要探索的最大节点数。例如,如果你设置 num_workers=3steps=21,树将增长到 21 个节点,每次 3 个节点。其他代理参数如 k_fold_validationexpose_predictiondata_preview 在当前版本中不使用。
    • num_seeds:如果 num_workers < 3,则应与 num_workers 相同。否则,设置为 3。
  • search 配置:

    • max_debug_depth:代理尝试调试节点的次数,直到放弃整个链。
    • debug_prob:调试节点的概率。
    • num_drafts:在阶段 1 开始时的根节点数量(要增长的树的数量)。

以下是一个运行 AI Scientist-v2 的示例命令(请查看 bfts_config.yaml 以获取树搜索参数,包括 claude-3-5-sonnet):

python launch_scientist_bfts.py \
 --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" \
 --load_code \
 --add_dataset_ref \
 --model_writeup o1-preview-2024-09-12 \
 --model_citation gpt-4o-2024-11-20 \
 --model_review gpt-4o-2024-11-20 \
 --model_agg_plots o3-mini-2025-01-31 \
 --num_cite_rounds 20

阶段 1 完成后,你应该会在 experiments 目录中看到一个带有时间戳的日志文件夹。在该文件夹中,导航到 "timestamp_ideaname"/logs/0-run 以找到 unified_tree_viz.html

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
16天前
|
机器学习/深度学习 人工智能 JSON
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。
150 18
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
|
15天前
|
数据可视化 Rust 机器学习/深度学习
mlop.ai 无脑使用教程 (机器学习工具 WandB/ClearML 的首个国区开源平替)
mlop.ai 是首个为国区用户优化的机器学习工具,全栈免费开源,是主流付费解决方案 ClearML/WandB 的开源平替。常规实验追踪的工具经常大幅人为降速,mlop因为底层为Rust代码,能轻松支持高频数据写入。如需更多开发者帮助或企业支持,敬请联系cn@mlop.ai
66 12
mlop.ai 无脑使用教程 (机器学习工具 WandB/ClearML 的首个国区开源平替)
|
21天前
|
人工智能 自然语言处理 监控
Cooragent:清华 LeapLab 开源 AI Agent 协作框架,一句话召唤AI军团!
Cooragent 是清华大学 LeapLab 团队推出的开源 AI Agent 协作框架,支持基于简单描述快速创建 Agent 并实现多 Agent 协作,具备 Prompt-Free 设计和本地部署能力。
197 6
Cooragent:清华 LeapLab 开源 AI Agent 协作框架,一句话召唤AI军团!
|
21天前
|
Web App开发 人工智能 自然语言处理
Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互
Open Avatar Chat是阿里开源的模块化数字人对话系统,支持文本/音频/视频多模态交互,采用可替换组件设计,平均响应延迟仅2.2秒,为开发者提供灵活高效的解决方案。
455 3
Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
Qwen3强势来袭:推理力爆表、语言超百种、智能体协作领先,引领AI开源大模型
Qwen3强势来袭:推理力爆表、语言超百种、智能体协作领先,引领AI开源大模型
Qwen3强势来袭:推理力爆表、语言超百种、智能体协作领先,引领AI开源大模型
|
17天前
|
人工智能 自然语言处理 搜索推荐
13.5K Star!支持5国语言+全栈语音生成,这个开源AI语音项目绝了!
CosyVoice是由FunAudioLLM团队开发的多语言大语音生成模型,支持中文、英语、日语、韩语和粤语等5种语言。该项目提供从推理、训练到部署的全栈能力,具备零样本语音克隆、跨语言合成、指令控制等前沿功能。其技术架构包括底层模型、多语言支持、框架支持及部方案等,性能优越,RTF&lt;0.2,GPU内存&lt;4GB,QPS&gt;20。相比同类项目,CosyVoice在语言支持、特色功能和部署难度上表现出色,支持本地部署保障数据隐私,并大幅降低商业方案成本。适用于自媒体创作、在线教育、游戏开发、智能硬件和影视制作等多种场景。
|
9天前
|
人工智能 数据挖掘 大数据
“龟速”到“光速”?算力如何加速 AI 应用进入“快车道”
阿里云将联合英特尔、蚂蚁数字科技专家,带来“云端进化论”特别直播。
49 11
|
23天前
|
开发框架 人工智能 Java
破茧成蝶:传统J2EE应用无缝升级AI原生
本文探讨了技术挑战和解决方案,还提供了具体的实施步骤,旨在帮助企业顺利实现从传统应用到智能应用的过渡。
破茧成蝶:传统J2EE应用无缝升级AI原生
|
10天前
|
开发框架 人工智能 Java
破茧成蝶:阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代
本文详细介绍了阿里云应用服务器如何助力传统J2EE应用实现智能化升级。文章分为三部分:第一部分阐述了传统J2EE应用在智能化转型中的痛点,如协议鸿沟、资源冲突和观测失明;第二部分展示了阿里云应用服务器的解决方案,包括兼容传统EJB容器与微服务架构、支持大模型即插即用及全景可观测性;第三部分则通过具体步骤说明如何基于EDAS开启J2EE应用的智能化进程,确保十年代码无需重写,轻松实现智能化跃迁。
|
1月前
|
人工智能 开发框架 安全
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力,用户只需提交 npx 命令即可“零改造”将开源 MCP Server 部署到云上,函数计算 FC 会准备好计算资源,并以弹性、可靠的方式运行 MCP 服务,按实际调用时长和次数计费,欢迎你在阿里云百炼和函数计算 FC 上体验 MCP 服务。
232 29

热门文章

最新文章