Shandu:开源AI研究黑科技!自动挖掘多层级信息,智能生成结构化报告

简介: Shandu 是一款开源的 AI 研究自动化工具,结合 LangChain 和 LangGraph 技术,能够自动化地进行多层次信息挖掘和分析,生成结构化的研究报告,适用于学术研究、市场分析和技术探索等多种场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🚀 「研究效率翻倍!开源神器Shandu实现AI自动化调研:递归搜索+智能分析一键出报告」

大家好,我是蚝油菜花。你是否也经历过这些崩溃瞬间——

  • 👉 为写论文通宵爬取30篇文献,结果50%链接失效
  • 👉 手动整理竞品分析,Excel表格堆到第20版还没理清逻辑
  • 👉 动态渲染网页信息抓不到,关键数据总在眼皮底下溜走...

今天要揭晓的 Shandu ,正在用AI重构科研工作流!这个基于LangChain和LangGraph的开源工具,能像专业研究员一样:

  • ✅ 智能递归探索:自动进行3层深度信息挖掘,发现隐藏关联
  • ✅ 跨引擎狩猎:同时调用Google/DuckDuckGo+动态网页解析
  • ✅ 结构化输出:直接生成带引用来源的Markdown报告

无论是学术研究、市场分析还是技术探索,Shandu 都能帮助你快速获取所需信息,提升研究效率。接下来,我们将深入探讨 Shandu 的核心功能和技术原理,手把手教你如何运行和使用这款强大的工具!

🚀 快速阅读

Shandu 是一款开源的 AI 研究自动化工具,结合 LangChain 和 LangGraph 技术,能够自动化地进行多层次信息挖掘和分析。

  1. 核心功能:支持递归探索、多引擎搜索、智能网页爬取和报告生成,适用于多种研究场景。
  2. 技术原理:基于 LangChain 和 LangGraph 技术,通过语言模型与外部数据源的结合,实现高效的信息检索和分析。

Shandu 是什么

shandu

Shandu 是一款开源的 AI 研究自动化工具,结合了 LangChain 和 LangGraph 技术,能够自动化地进行多层次信息挖掘和分析,生成结构化的研究报告。用户可以通过简单的命令行操作,输入研究主题,设置深度和广度参数,快速生成包含引用的 Markdown 格式研究报告。

Shandu 支持 Google、DuckDuckGo 等搜索引擎,能够处理动态渲染的网页内容,适合学术研究、市场情报和技术探索等多种场景。无论是学术研究、市场分析还是技术探索,Shandu 都能帮助你快速获取所需信息,提升研究效率。

Shandu 的主要功能

  • 自动化研究:用户只需输入研究主题,Shandu 会自动执行多层次的信息挖掘,生成详细的结构化报告。
  • 递归探索:通过多轮迭代搜索,逐步深入挖掘隐藏信息,确保研究的深度和广度。
  • 多引擎搜索:支持 Google、DuckDuckGo 等主流搜索引擎,结合网页爬取技术,获取更全面的信息。
  • 智能网页爬取:能处理动态渲染的网页,提取关键内容,避免无关信息干扰。
  • 报告生成:将研究成果整理为 Markdown 格式的报告,包含引用和链接,方便用户阅读和分享。
  • 灵活的参数设置:用户可以根据需求调整研究的深度(递归层级)和广度(每层搜索结果数量),适应不同的研究场景。
  • 快速 AI 搜索:提供快速问答功能,适合简单问题的即时解答。

Shandu 的技术原理

  • LangChain技术:LangChain 是用于构建语言模型应用的框架,通过将语言模型与外部数据源(如搜索引擎、文档等)结合,实现信息的高效检索和分析。
  • LangGraph技术:LangGraph 可能用于构建知识图谱,通过图结构存储和分析数据,帮助 Shandu 在复杂信息中找到关联和逻辑关系。

如何运行 Shandu

安装

# 从 PyPI 安装
pip install shandu

# 从源码安装
git clone https://github.com/jolovicdev/shandu.git
cd shandu
pip install -e .

快速开始

# 配置 API 设置(支持多种 LLM 提供商)
shandu configure

# 运行综合研究
shandu research "你的研究主题" --depth 2 --breadth 4 --output report.md

# 快速 AI 搜索(带网页爬取)
shandu aisearch "美国现任总统是谁?" --detailed

# 基本多引擎搜索
shandu search "你的搜索主题"

详细用法

研究命令

shandu research "你的研究主题" \
    --depth 3 \                # 探索深度(1-5,默认:2)
    --breadth 5 \              # 并行查询数量(2-10,默认:4)
    --output report.md \       # 保存到文件
    --verbose                  # 显示详细进度

AI 搜索命令(带爬取)

shandu aisearch "你的搜索主题" \
    --engines "google,duckduckgo" \  # 搜索引擎列表
    --max-results 15 \               # 最大结果数
    --output results.md \            # 保存到文件
    --detailed                       # 生成详细分析

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
人工智能 自然语言处理 Devops
云效 AI 智能代码评审体验指南
云效AI智能代码评审正式上线!在合并请求时自动分析代码,精准识别问题,提升交付效率与质量。支持自定义规则、多语言评审,助力研发效能升级。立即体验AI驱动的代码评审革新,让AI成为你的代码质量伙伴!
627 7
|
5月前
|
人工智能 自然语言处理 算法
【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”
2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”
694 9
|
5月前
|
机器学习/深度学习 人工智能 算法
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
本数据集包含2500张已标注实验室设备图片,涵盖空调、灭火器、显示器等10类常见设备,适用于YOLO等目标检测模型训练。数据多样、标注规范,支持智能巡检、设备管理与科研教学,助力AI赋能智慧实验室建设。
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
|
5月前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
555 5
我们开源了一款 AI 驱动的用户社区
|
5月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
981 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
5月前
|
人工智能 编解码 搜索推荐
AI智能换背景,助力电商图片营销升级
电商产品图换背景是提升销量与品牌形象的关键。传统抠图耗时费力,AI技术则实现一键智能换背景,高效精准。本文详解燕雀光年AI全能设计、Canva、Remove.bg等十大AI工具,涵盖功能特点与选型建议,助力商家快速打造高质量、高吸引力的商品图,提升转化率与品牌价值。(238字)
583 0

热门文章

最新文章