OpenDeepResearcher:开源 AI 研究工具,自动完成搜索、评估、提取和生成报告

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: OpenDeepResearcher 是一款开源 AI 研究工具,支持异步处理、去重功能和 LLM 驱动的决策,帮助用户高效完成复杂的信息查询和分析任务。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 工具介绍:OpenDeepResearcher 是一款开源 AI 研究工具,能自动完成从搜索到报告生成的全过程。
  2. 主要功能:支持迭代研究循环、异步处理、去重功能和 LLM 驱动的决策。
  3. 技术原理:利用 SERPAPI、Jina 和 OpenRouter 提供的 LLM 进行搜索、数据获取和推理。

正文(附运行示例)

OpenDeepResearcher 是什么

OpenDeepResearcher

OpenDeepResearcher 是一款开源的 AI 研究工具,旨在帮助用户高效地完成复杂的信息查询和分析任务。基于迭代搜索和推理,系统能够自动从网络中获取相关数据,并生成综合报告。用户只需输入研究主题,系统即可自动完成搜索、评估、提取和报告生成的全过程。这使得 OpenDeepResearcher 成为金融、科学、政策和工程等领域研究人员的理想选择,提供了低成本且高效的解决方案。

OpenDeepResearcher 支持异步处理,显著提高了处理速度和效率。此外,系统具备去重功能,避免重复处理相同内容,进一步节省时间和资源。通过大型语言模型(LLM)驱动的决策,系统能够生成高质量的搜索查询、评估页面的相关性、提取关键信息,并最终生成详细的综合报告。

OpenDeepResearcher 的主要功能

  • 迭代研究循环:根据用户输入的研究主题,系统生成初始搜索查询,并在每次迭代中逐步细化研究范围,直到满足研究目标或达到设定的迭代次数。
  • 异步处理:搜索、网页抓取、页面评估和上下文提取等操作并行执行,显著提高处理速度和效率。
  • 去重功能:系统自动聚合和去重链接,避免重复处理相同的网页内容,节省时间和资源。
  • LLM 驱动的决策:使用大型语言模型(LLM)生成搜索查询、评估页面的相关性、提取关键信息,并生成最终的综合报告。

OpenDeepResearcher 的技术原理

  • 搜索与数据获取:使用 SERPAPI 进行 Google 搜索,快速获取与用户查询相关的网页链接。基于 Jina 提取网页内容,将 HTML 网页转换为适合 LLM 处理的纯文本格式。
  • LLM 驱动的推理:使用 OpenRouter 提供的 LLM(如 anthropic/claude-3.5-haiku)进行自然语言处理和推理。LLM 负责生成搜索查询、评估网页的相关性、提取关键信息,并决定是否需要进一步的搜索。
  • 迭代优化:系统将每次迭代获取的信息反馈给 LLM,根据 LLM 的评估结果生成新的搜索查询,逐步优化研究结果。
  • 异步处理与去重:使用 nest_asyncio 等异步编程技术,实现搜索、抓取、评估和提取的并行处理。基于去重机制,避免重复处理相同的链接,提高效率。

如何运行 OpenDeepResearcher

1. 克隆或打开 Notebook

下载 Notebook 文件或直接在Google Colab中打开。

OpenDeepResearcher-colab

2. 安装 nest_asyncio

运行第一个代码单元格以安装 nest_asyncio

3. 配置 API 密钥

将笔记本中的 OPENROUTER_API_KEYSERPAPI_API_KEYJINA_API_KEY 替换为你的实际 API 密钥。

4. 运行 Notebook 单元格

依次执行所有单元格。系统将提示你输入:

  • 研究查询/主题。
  • 可选的最大迭代次数(默认为 10)。

5. 跟随研究过程

  • 初始查询与搜索生成:系统使用 LLM 生成初始搜索查询。
  • 异步搜索与提取:系统并发执行 SERPAPI 搜索,聚合唯一链接,并并行处理每个链接以确定页面的相关性和提取相关信息。
  • 迭代优化:每次迭代后,系统将聚合的上下文传递给 LLM,判断是否需要进一步的搜索查询。
  • 最终报告生成:一旦 LLM 表示无需进一步研究(或达到迭代限制),系统将生成最终的综合报告。

6. 查看最终报告

最终的综合报告将在输出中显示。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
2天前
|
设计模式 人工智能 API
Cursor 上线最新 AI 模型 Claude 3.7 Max:200k上下文+200次工具调用!史上最强代码助手硬核上线
Claude 3.7 Max 是 Cursor 推出的最新 AI 模型,支持 200k 上下文窗口和 200 次工具调用,专为复杂代码任务设计,适合硬核开发者和大型项目。
98 6
Cursor 上线最新 AI 模型 Claude 3.7 Max:200k上下文+200次工具调用!史上最强代码助手硬核上线
|
2天前
|
机器学习/深度学习 人工智能 数据处理
OpenBioMed:开源生物医学AI革命!20+工具链破解药物研发「死亡谷」
OpenBioMed 是清华大学智能产业研究院(AIR)和水木分子共同推出的开源平台,专注于 AI 驱动的生物医学研究,提供多模态数据处理、丰富的预训练模型和多样化的计算工具,助力药物研发、精准医疗和多模态理解。
32 1
OpenBioMed:开源生物医学AI革命!20+工具链破解药物研发「死亡谷」
|
2天前
|
机器学习/深度学习 人工智能 运维
AI和开源时代的计算机课程建设和改革建议
人工智能与开源技术正深刻影响高校计算机教育。通过构建“AI+开源”驱动的课程体系,深化专业课AI融合,强化跨学科项目学习,可培养复合型人才。同时,打造开源实验平台、推广智能教学模式、共建产教融合生态,并加强AI伦理教育,将推动教育数字化转型。Websoft9等工具为连接理论与实践提供支持,助力高校培养适应未来的技术人才。
|
2天前
|
机器学习/深度学习 人工智能 数据可视化
1.4K star!几分钟搞定AI视频创作,这个开源神器让故事可视化如此简单!
story-flicks 是一个基于AI技术的自动化视频生成工具,能够将文字剧本快速转化为高质量短视频。开发者@alecm20通过深度学习算法,实现了从文本解析到视频合成的全流程自动化处理,支持多平台适配输出,是内容创作者和自媒体运营者的效率神器。
|
1天前
|
人工智能 监控 数据可视化
Manus再遭复刻!开源多智能体协作工具,实时查看每个AI员工的"脑回路"
LangManus 是一个基于分层多智能体系统的 AI 自动化框架,支持多种语言模型和工具集成,能够高效完成复杂任务,适用于人力资源、房产决策、旅行规划等多个场景。
124 0
|
24天前
|
人工智能 Java API
Java也能快速搭建AI应用?一文带你玩转Spring AI可落地性
Java语言凭借其成熟的生态与解决方案,特别是通过 Spring AI 框架,正迅速成为 AI 应用开发的新选择。本文将探讨如何利用 Spring AI Alibaba 构建在线聊天 AI 应用,并实现对其性能的全面可观测性。
|
18天前
|
人工智能 弹性计算 Ubuntu
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
本文介绍了如何使用阿里云提供的DeepSeek-R1大模型解决方案,通过Chatbox和Dify平台调用百炼API,实现稳定且高效的模型应用。首先,文章详细描述了如何通过Chatbox配置API并开始对话,适合普通用户快速上手。接着,深入探讨了使用Dify部署AI应用的过程,包括选购云服务器、安装Dify、配置对接DeepSeek-R1模型及创建工作流,展示了更复杂场景下的应用潜力。最后,对比了Chatbox与Dify的输出效果,证明Dify能提供更详尽、精准的回复。总结指出,阿里云的解决方案不仅操作简便,还为专业用户提供了强大的功能支持,极大提升了用户体验和应用效率。
976 19
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
|
11天前
|
人工智能 前端开发 JavaScript
AI程序员:通义灵码 2.0应用VScode前端开发深度体验
AI程序员:通义灵码 2.0应用VScode前端开发深度体验,在软件开发领域,人工智能技术的融入正深刻改变着程序员的工作方式。通义灵码 2.0 作为一款先进的 AI 编程助手,与广受欢迎的代码编辑器 Visual Studio Code(VScode)相结合,为前端开发带来了全新的可能性。本文将详细分享通义灵码 2.0 在 VScode 前端开发环境中的深度使用体验。
133 2
|
5天前
|
Web App开发 人工智能 机器人
牛逼,这款开源聊天应用竟能一键召唤多个AI助手,跨平台通话神器!
`JiwuChat`是一款基于Tauri2和Nuxt3构建的轻量化多平台即时通讯工具,仅约8MB体积却集成了**AI群聊机器人**、**WebRTC音视频通话**、**屏幕共享**等前沿功能。一套代码适配Windows/macOS/Linux/Android/iOS/Web六大平台,堪称开发者学习跨端开发的绝佳样板!
|
3天前
|
人工智能 运维 Serverless
一键轻松打造你的专属AI应用!
函数计算提供免运维、Serverless GPU,具备极致弹性与按量付费优势,助您一键部署AI大模型,加速业务创新。

热门文章

最新文章