自动查文献+写代码+跑数据+出报告!港大开源 Auto Deep Research 搞定科研全流程

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: Auto-Deep-Research 是一款由香港大学开源的个人 AI 助理,基于模块化多 Agent 架构,专注于深度研究任务,兼容多种大语言模型,并提供一键启动和文件解析等强大功能。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🧠 "实验室经费在燃烧?这个开源项目如何用三个AI分身搞定科研全流程!"

大家好,我是蚝油菜花。当你还在:

  • 🔧 手动整理上百篇文献摘要到凌晨3点
  • 💸 为GPT-4的API账单心惊肉跳
  • 🤯 在Python脚本和Excel表格间反复横跳...

Auto-Deep-Research 带来了变革性解决方案!这个由港大黄超教授团队开源的多Agent系统,集成了:

  • ✅ 文献蜘蛛:自动抓取最新研究成果并生成综述
  • ✅ 代码医师:debug数据分析脚本+自动优化可视化
  • ✅ 报告管家:按期刊模板一键生成完整论文

依托 模块化调度器 ,这些AI分身能:

  • 🔄 自主协商任务分配(比如先爬数据再建模)
  • 💡 支持4大类LLM随时切换(Anthropic/OpenAI/Mistral/HF)
  • 📦 容器化部署避免环境依赖噩梦

现在,让我们一起揭开这个开源科研利器 Auto-Deep-Research 的技术面纱!

🚀 快速阅读

Auto-Deep-Research 是一个专注于复杂任务自动化的开源 AI 助理。

  1. 核心功能:支持深度研究、多格式文件解析、网络搜索与编程实现。
  2. 技术原理:采用模块化多 Agent 架构,协同完成互联网信息搜索、编程调试与文件处理任务。

Auto-Deep-Research 是什么

Auto-Deep-Research

Auto-Deep-Research 是香港大学黄超教授实验室开源的一款全自动个人 AI 助理,旨在成为 OpenAI Deep Research 的开源替代方案。它基于 AutoAgent 框架开发,采用模块化的多 Agent 架构设计,包含 Web Agent(互联网信息搜索)、Coding Agent(编程实现与调试)和 Local File Agent(文件解析与理解)。这些 Agent 通过核心调度器(Orchestrator Agent)协同工作,为用户提供高效的任务自动化处理能力。

该项目专注于复杂任务的自动化处理,如文件解析、数据分析与可视化,并能够生成详细的报告。Auto-Deep-Research 兼容多种大语言模型(LLM),包括 Anthropic、OpenAI、Mistral 和 Hugging Face 等,同时支持导入浏览器 Cookies,以更好地访问特定网站。

此外,Auto-Deep-Research 以其高性价比著称,仅基于 Claude-3.5-Sonnet 构建,大幅降低了使用成本,是研究人员、教育工作者和企业用户的理想选择。

Auto-Deep-Research 的主要功能

  • 深度研究功能:专注于复杂任务的自动化处理,如文件解析、网络搜索、数据分析与可视化,生成高质量的研究报告。
  • 多语言模型支持:兼容多种大语言模型(LLM),包括 Anthropic、OpenAI、Mistral、Hugging Face 等。
  • 高性价比:基于 Claude-3.5-Sonnet 构建,显著降低使用成本。
  • 社区驱动改进:根据社区反馈增加了如一键启动和增强的 LLM 兼容性等功能。
  • 易于部署:支持通过 Conda 环境或 Docker 安装,提供详细的启动配置选项。

Auto-Deep-Research 的技术原理

  • 多 Agent 架构:包含 Web Agent(互联网信息搜索)、Coding Agent(编程实现与调试)和 Local File Agent(文件解析与理解),通过核心调度器(Orchestrator Agent)协同工作。
  • Web Agent:专注于互联网信息的无障碍访问和深度搜索。
  • Coding Agent:负责编程实现和调试,具备严密的逻辑分析能力。
  • Local File Agent:致力于多格式文件的解析和内容理解。

如何运行 Auto-Deep-Research

下面将指导你如何安装 Docker、配置 API 密钥以及启动 Auto-Deep-Research。同时将展示如何通过不同 LLM 提供商运行 Auto-Deep-Research,并提供一些实用技巧。

1. Docker 安装

Auto-Deep-Research 使用 Docker 来容器化交互环境,因此请先安装Docker。你无需手动拉取预构建的镜像,因为 Auto-Deep-Research 会根据你的机器架构自动拉取对应的镜像。

2. API 密钥设置

创建一个环境变量文件(例如 .env),并在其中设置你计划使用的 LLM 的 API 密钥。并非所有 LLM 的 API 密钥都是必需的,根据你的需求进行设置即可。

示例 .env 文件内容:

ANTHROPIC_API_KEY=your_anthropic_api_key
OPENAI_API_KEY=your_openai_api_key

3. 启动 Auto-Deep-Research

命令选项

运行 auto deep-research 命令以启动 Auto-Deep-Research。以下是一些常用配置选项:

  1. --container_name:指定 Docker 容器的名称(默认值:deepresearch)。
  2. --port:指定容器使用的端口(默认值:12346)。
  3. COMPLETION_MODEL:指定要使用的 LLM 模型,需遵循Litellm的命名规范(默认值:claude-3-5-sonnet-20241022)。
  4. DEBUG:启用调试模式以获取详细日志(默认值:False)。
  5. API_BASE_URL:指定 LLM 提供商的 API 基础 URL(默认值:None)。
  6. FN_CALL:启用函数调用功能(默认值:None)。大多数情况下可以忽略此选项,因为我们已经根据模型名称设置了默认值。

使用不同 LLM 提供商启动 Auto-Deep-Research

Anthropic

设置 API 密钥

.env 文件中设置 ANTHROPIC_API_KEY

ANTHROPIC_API_KEY=your_anthropic_api_key

启动命令

运行以下命令启动 Auto-Deep-Research:

auto deep-research

默认模型为 claude-3-5-sonnet-20241022

OpenAI

设置 API 密钥

.env 文件中设置 OPENAI_API_KEY

OPENAI_API_KEY=your_openai_api_key

启动命令

运行以下命令启动 Auto-Deep-Research:

COMPLETION_MODEL=gpt-4o auto deep-research

Mistral

设置 API 密钥

.env 文件中设置 MISTRAL_API_KEY

MISTRAL_API_KEY=your_mistral_api_key

启动命令

运行以下命令启动 Auto-Deep-Research:

COMPLETION_MODEL=mistral/mistral-large-2407 auto deep-research

Gemini - Google AI Studio

设置 API 密钥

.env 文件中设置 GEMINI_API_KEY

GEMINI_API_KEY=your_gemini_api_key

启动命令

运行以下命令启动 Auto-Deep-Research:

COMPLETION_MODEL=gemini/gemini-2.0-flash auto deep-research

Huggingface

设置 API 密钥

.env 文件中设置 HUGGINGFACE_API_KEY

HUGGINGFACE_API_KEY=your_huggingface_api_key

启动命令

运行以下命令启动 Auto-Deep-Research:

COMPLETION_MODEL=huggingface/meta-llama/Llama-3.3-70B-Instruct auto deep-research

Groq

设置 API 密钥

.env 文件中设置 GROQ_API_KEY

GROQ_API_KEY=your_groq_api_key

启动命令

运行以下命令启动 Auto-Deep-Research:

COMPLETION_MODEL=groq/deepseek-r1-distill-llama-70b auto deep-research

OpenAI-Compatible Endpoints(例如 Grok)

设置 API 密钥

.env 文件中设置 OPENAI_API_KEY

OPENAI_API_KEY=your_api_key_for_openai_compatible_endpoints

启动命令

运行以下命令启动 Auto-Deep-Research:

COMPLETION_MODEL=openai/grok-2-latest API_BASE_URL=https://api.x.ai/v1 auto deep-research

OpenRouter(例如 DeepSeek-R1)

我们建议暂时使用 OpenRouter 作为 DeepSeek-R1 的 LLM 提供商,因为官方 API 的效率较低。

设置 API 密钥

.env 文件中设置 OPENROUTER_API_KEY

OPENROUTER_API_KEY=your_openrouter_api_key

启动命令

运行以下命令启动 Auto-Deep-Research:

COMPLETION_MODEL=openrouter/deepseek/deepseek-r1 auto deep-research

DeepSeek

设置 API 密钥

.env 文件中设置 DEEPSEEK_API_KEY

DEEPSEEK_API_KEY=your_deepseek_api_key

启动命令

运行以下命令启动 Auto-Deep-Research:

COMPLETION_MODEL=deepseek/deepseek-chat auto deep-research

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
9月前
|
人工智能 JSON PyTorch
TPO:告别微调!这个AI框架让大模型实时进化:无需训练直接优化,输入问题越用越聪明,输出质量暴涨50%
TPO(Test-Time Prompt Optimization)框架,通过奖励模型和迭代反馈优化大语言模型输出,无需训练即可显著提升性能,支持动态对齐人类偏好,降低优化成本。
605 8
TPO:告别微调!这个AI框架让大模型实时进化:无需训练直接优化,输入问题越用越聪明,输出质量暴涨50%
|
存储 Shell 持续交付
最全总结,GitHub Action自动化部署
GitHub Actions使你可以直接在你的GitHub库中创建自定义的工作流,工作流指的就是自动化的流程,比如构建、测试、打包、发布、部署等等,也就是说你可以直接进行 CI(持续集成)和 CD(持续部署)。 简单地说,就是利用官方以及第三方提供的actions,组合action来实现一些你能做到的其他事情,比如抓取代码、运行测试、登录远程服务器,发布到第三方服务等等。
982 0
最全总结,GitHub Action自动化部署
|
9月前
|
人工智能 Linux API
Omnitool:开发者桌面革命!开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台,本地运行不联网
Omnitool 是一款开源的 AI 桌面环境,支持本地运行,提供统一交互界面,快速接入 OpenAI、Stable Diffusion、Hugging Face 等主流 AI 平台,具备高度扩展性。
1005 94
Omnitool:开发者桌面革命!开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台,本地运行不联网
|
8月前
|
人工智能 自然语言处理 算法
AI-Researcher:告别熬夜肝论文!港大开源AI科研神器,从选题到发表全自动
AI-Researcher 是香港大学数据科学实验室推出的开源自动化科研工具,基于大型语言模型(LLM)代理,支持从研究想法到论文发表的全流程自动化,涵盖文献综述、算法设计、实验验证和论文撰写等功能。
747 8
AI-Researcher:告别熬夜肝论文!港大开源AI科研神器,从选题到发表全自动
|
9月前
|
人工智能 自然语言处理 数据可视化
AutoAgents:比LangChain更激进的AI开发神器!自然语言生成AI智能体军团,1句话搞定复杂任务
AutoAgents 是基于大型语言模型的自动智能体生成框架,能够根据用户设定的目标自动生成多个专家角色的智能体,通过协作完成复杂任务。支持动态生成智能体、任务规划与执行、多智能体协作等功能。
1542 91
|
9月前
|
人工智能 监控 自动驾驶
Migician:清北华科联手放大招!多图像定位大模型问世:3秒锁定跨画面目标,安防监控迎来AI革命!
Migician 是北交大联合清华、华中科大推出的多模态视觉定位模型,支持自由形式的跨图像精确定位、灵活输入形式和多种复杂任务。
291 3
Migician:清北华科联手放大招!多图像定位大模型问世:3秒锁定跨画面目标,安防监控迎来AI革命!
|
9月前
|
数据采集 机器学习/深度学习 人工智能
Sitcom-Crafter:动画师失业警告!AI黑科技自动生成3D角色动作,剧情脚本秒变动画
Sitcom-Crafter 是一款基于剧情驱动的 3D 动作生成系统,通过多模块协同工作,支持人类行走、场景交互和多人交互,适用于动画、游戏及虚拟现实等领域。
556 4
|
9月前
|
人工智能 文字识别 安全
Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具
Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具,支持 50 多种 PDF 操作,包括合并、拆分、转换、压缩等,同时提供多语言支持和企业级功能,满足个人和企业用户的多样化需求。
804 6
Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具
|
9月前
|
人工智能 自然语言处理 API
ComfyUI-Copilot:阿里把AI助手塞进ComfyUI:一句话生成工作流,自动布线/调参/选模型,小白秒变大神!
ComfyUI-Copilot 是阿里推出的基于 ComfyUI 的 AI 智能助手,支持自然语言交互、智能节点推荐和自动工作流辅助,降低开发门槛并提升效率。
2508 9
ComfyUI-Copilot:阿里把AI助手塞进ComfyUI:一句话生成工作流,自动布线/调参/选模型,小白秒变大神!

热门文章

最新文章