❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦
🎯 「还在手抄论文公式?这个AI把arXiv变成代码工厂,1小时复现顶会算法!」
大家好,我是蚝油菜花。你是否也经历过这些科研至暗时刻——
- 👉 复现论文时发现作者没开源代码,反向工程做到怀疑人生
- 👉 手动实现Transformer注意力机制,矩阵维度错一位debug三天
- 👉 导师突然要对比十篇顶会方法,熬夜赶工到咖啡因中毒...
今天要解剖的 Paper2Code ,正在用多智能体LLM重写科研工作流!这个韩国科研天团打造的「论文编译器」:
- ✅ 三阶段精准拆解:从架构设计到代码生成全自动流水线
- ✅ 代码质量碾压人类:在PaperBench测试集上超越基线模型
- ✅ 工业级复现精度:连Attention Is All You Need都能1:1还原
已有团队用它1天复现5篇顶会论文,文末附《从PDF到GitHub仓库保姆指南》——你的科研效率,是时候开启「自动驾驶」模式了!
🚀 快速阅读
Paper2Code是基于多智能体LLM的论文转代码框架。
- 功能:通过规划、分析、生成三阶段实现论文到代码的自动转换
- 技术:采用专用Agent分工协作,确保代码结构清晰且符合论文原意
Paper2Code 是什么
Paper2Code 是韩国科学技术院和DeepAuto.ai联合推出的多 Agent 大语言模型(LLM)框架,支持将机器学习领域的科学论文自动转换为可运行的代码仓库。
Paper2Code基于三个阶段实现这一目标,规划(构建系统架构、生成配置文件)、分析(解读实现细节)和代码生成(生成模块化代码)。Paper2Code 在多个基准测试中表现出色,生成的代码质量高,忠实于原始论文,显著加速科学研究的复现和进一步发展。
Paper2Code 的主要功能
- 自动化代码生成:将机器学习论文自动转换为功能性的代码仓库
- 高质量代码输出:生成的代码结构清晰,忠实于原始论文,支持快速复现和验证研究成果
- 效率提升:自动化流程大幅减少手动实现代码的时间和精力,加速科学研究的迭代和创新
Paper2Code 的技术原理
- 多Agent大语言模型(LLM):采用专用Agent处理不同阶段任务
- 规划阶段(Planning):用自然语言处理技术提取关键信息,生成系统架构图和文件依赖关系
- 分析阶段(Analysis):基于 LLM 的推理能力,生成详细的实现指南
- 代码生成阶段(Coding):根据前两阶段输出生成模块化、依赖关系明确的代码
- 评估与反馈:通过模型评估和人类专家验证确保代码质量
如何运行 Paper2Code
快速开始
运行示例论文《Attention Is All You Need》的转换:
pip install openai
export OPENAI_API_KEY="<OPENAI_API_KEY>"
cd scripts
bash run.sh
输出目录结构
outputs
├── Transformer
│ ├── analyzing_artifacts
│ ├── coding_artifacts
│ └── planning_artifacts
└── Transformer_repo # 最终输出的代码仓库
详细设置
环境配置
安装OpenAI最新版:
pip install openai
PDF转JSON
1. 克隆s2orc-doc2json仓库:
git clone https://github.com/allenai/s2orc-doc2json.git
2. 运行PDF处理服务:
cd ./s2orc-doc2json/grobid-0.7.3
./gradlew run
3. 转换PDF为JSON格式:
mkdir -p ./s2orc-doc2json/output_dir/paper_coder
python ./s2orc-doc2json/doc2json/grobid2json/process_pdf.py \
-i ${PDF_PATH} \
-t ./s2orc-doc2json/temp_dir/ \
-o ./s2orc-doc2json/output_dir/paper_coder
🚀 运行PaperCoder
设置API密钥后执行:
export OPENAI_API_KEY="<OPENAI_API_KEY>"
cd scripts
bash run.sh
资源
- GitHub 仓库:https://github.com/going-doer/Paper2Code
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦