Shandu:开源AI研究黑科技!自动挖掘多层级信息,智能生成结构化报告

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: Shandu 是一款开源的 AI 研究自动化工具,结合 LangChain 和 LangGraph 技术,能够自动化地进行多层次信息挖掘和分析,生成结构化的研究报告,适用于学术研究、市场分析和技术探索等多种场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🚀 「研究效率翻倍!开源神器Shandu实现AI自动化调研:递归搜索+智能分析一键出报告」

大家好,我是蚝油菜花。你是否也经历过这些崩溃瞬间——

  • 👉 为写论文通宵爬取30篇文献,结果50%链接失效
  • 👉 手动整理竞品分析,Excel表格堆到第20版还没理清逻辑
  • 👉 动态渲染网页信息抓不到,关键数据总在眼皮底下溜走...

今天要揭晓的 Shandu ,正在用AI重构科研工作流!这个基于LangChain和LangGraph的开源工具,能像专业研究员一样:

  • ✅ 智能递归探索:自动进行3层深度信息挖掘,发现隐藏关联
  • ✅ 跨引擎狩猎:同时调用Google/DuckDuckGo+动态网页解析
  • ✅ 结构化输出:直接生成带引用来源的Markdown报告

无论是学术研究、市场分析还是技术探索,Shandu 都能帮助你快速获取所需信息,提升研究效率。接下来,我们将深入探讨 Shandu 的核心功能和技术原理,手把手教你如何运行和使用这款强大的工具!

🚀 快速阅读

Shandu 是一款开源的 AI 研究自动化工具,结合 LangChain 和 LangGraph 技术,能够自动化地进行多层次信息挖掘和分析。

  1. 核心功能:支持递归探索、多引擎搜索、智能网页爬取和报告生成,适用于多种研究场景。
  2. 技术原理:基于 LangChain 和 LangGraph 技术,通过语言模型与外部数据源的结合,实现高效的信息检索和分析。

Shandu 是什么

shandu

Shandu 是一款开源的 AI 研究自动化工具,结合了 LangChain 和 LangGraph 技术,能够自动化地进行多层次信息挖掘和分析,生成结构化的研究报告。用户可以通过简单的命令行操作,输入研究主题,设置深度和广度参数,快速生成包含引用的 Markdown 格式研究报告。

Shandu 支持 Google、DuckDuckGo 等搜索引擎,能够处理动态渲染的网页内容,适合学术研究、市场情报和技术探索等多种场景。无论是学术研究、市场分析还是技术探索,Shandu 都能帮助你快速获取所需信息,提升研究效率。

Shandu 的主要功能

  • 自动化研究:用户只需输入研究主题,Shandu 会自动执行多层次的信息挖掘,生成详细的结构化报告。
  • 递归探索:通过多轮迭代搜索,逐步深入挖掘隐藏信息,确保研究的深度和广度。
  • 多引擎搜索:支持 Google、DuckDuckGo 等主流搜索引擎,结合网页爬取技术,获取更全面的信息。
  • 智能网页爬取:能处理动态渲染的网页,提取关键内容,避免无关信息干扰。
  • 报告生成:将研究成果整理为 Markdown 格式的报告,包含引用和链接,方便用户阅读和分享。
  • 灵活的参数设置:用户可以根据需求调整研究的深度(递归层级)和广度(每层搜索结果数量),适应不同的研究场景。
  • 快速 AI 搜索:提供快速问答功能,适合简单问题的即时解答。

Shandu 的技术原理

  • LangChain技术:LangChain 是用于构建语言模型应用的框架,通过将语言模型与外部数据源(如搜索引擎、文档等)结合,实现信息的高效检索和分析。
  • LangGraph技术:LangGraph 可能用于构建知识图谱,通过图结构存储和分析数据,帮助 Shandu 在复杂信息中找到关联和逻辑关系。

如何运行 Shandu

安装

# 从 PyPI 安装
pip install shandu

# 从源码安装
git clone https://github.com/jolovicdev/shandu.git
cd shandu
pip install -e .

快速开始

# 配置 API 设置(支持多种 LLM 提供商)
shandu configure

# 运行综合研究
shandu research "你的研究主题" --depth 2 --breadth 4 --output report.md

# 快速 AI 搜索(带网页爬取)
shandu aisearch "美国现任总统是谁?" --detailed

# 基本多引擎搜索
shandu search "你的搜索主题"

详细用法

研究命令

shandu research "你的研究主题" \
    --depth 3 \                # 探索深度(1-5,默认:2)
    --breadth 5 \              # 并行查询数量(2-10,默认:4)
    --output report.md \       # 保存到文件
    --verbose                  # 显示详细进度

AI 搜索命令(带爬取)

shandu aisearch "你的搜索主题" \
    --engines "google,duckduckgo" \  # 搜索引擎列表
    --max-results 15 \               # 最大结果数
    --output results.md \            # 保存到文件
    --detailed                       # 生成详细分析

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
21天前
|
人工智能 安全 API
HiMarket 正式开源,为企业落地开箱即用的 AI 开放平台
我们发起 HiMarket 的初心:帮助用户从 80% 开始构建 AI 开放平台。
129 18
|
19天前
|
人工智能 运维 安全
|
9天前
|
存储 人工智能 Java
AI 超级智能体全栈项目阶段三:自定义 Advisor 与结构化输出实现以及对话记忆持久化开发
本文介绍如何在Spring AI中自定义Advisor实现日志记录、结构化输出、对话记忆持久化及多模态开发,结合阿里云灵积模型Qwen-Plus,提升AI应用的可维护性与功能性。
315 125
AI 超级智能体全栈项目阶段三:自定义 Advisor 与结构化输出实现以及对话记忆持久化开发
|
21天前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
611 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
21天前
|
数据采集 人工智能 JSON
学会“读网页”:生成式 AI 在足球赛事信息整理中的实战
本文介绍了一个足球比赛信息提取教程,利用生成式AI从ESPN、虎扑、腾讯体育等网站抓取比赛报道,抽取比分、关键事件和球员表现等信息。步骤包括采集、清洗、分块、调用LLM抽取、校验与落地,以及可视化。需要准备Python环境、安装依赖库,并遵循合规性。提供了示例代码,演示如何从网页抓取文本并调用LLM接口获得结构化输出。
|
9天前
|
人工智能 安全 架构师
开放、协同,2025 云栖大会“操作系统开源与 AI 进化分论坛”精彩回顾
唯有通过生态开放与技术共享,才能加速 AI 技术的普惠与产业化落地。
|
21天前
|
人工智能
四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」
四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」
102 8
|
9天前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
|
15天前
|
存储 人工智能 Serverless
函数计算进化之路:AI 应用运行时的状态剖析
AI应用正从“请求-响应”迈向“对话式智能体”,推动Serverless架构向“会话原生”演进。阿里云函数计算引领云上 AI 应用 Serverless 运行时技术创新,实现性能、隔离与成本平衡,开启Serverless AI新范式。
222 12

热门文章

最新文章