DeepSeek-V3.2是性能跃迁的一代。其核心优势在于,以极致的成本效益,提供了顶级的推理能力。它在权威测试中超越了GPT-4o,但API价格仅为其百分之一,真正做到了“好用不贵”。同时支持长达128K的上下文以及更强大agent能力,在联网搜索场景下,可以分析和选择出最准确的数据源,作为回答引用。
在AI快速发展的今天,大语言模型虽然拥有海量知识,但面对实时信息、最新事件或特定网页内容时,往往显得力不从心。
(上图为DeepSeek V3.2联网搜索得出的信息并非实时更新资讯)
作为一款大模型,在解决一些比较实时的问题时,DeepSeek本身无法获取最新的数据和阅读网页,要发挥DeepSeek V3.2的最大能力,就必须给他解锁联网搜索和阅读网页的能力,让大模型自己查资料!
那么,如何系统性地为AI助手赋予联网搜索能力,获取最新、最准确的信息?
本文将详细介绍如何基于Dify平台,高效地搭建一个功能完整的联网搜索助手。此方案能充分发挥DeepSeek V3.2“思考与工具调用融合”的先进能力,系统性解决AI助手的实时信息获取难题。
什么是 Dify 联网搜索?
Dify 是一个强大的 LLM 应用开发平台,通过可视化工作流设计,我们可以轻松构建具备联网搜索能力的 AI 助手。与传统的本地部署方案不同,Dify 提供了更加便捷和稳定的解决方案。
核心架构设计
URL 提取模块
def main(response): results = response[0].get("webPages", []) urls = [] for item in results[:5]: urls.append(item.get("url")) return {"results": urls}
从搜索结果中提取前 5 个最相关的 URL,为后续内容获取做准备。
内容格式化模块
模板:[webpage {{ i+1 }} begin] {{ text }} [webpage {{ i+1 }} end]
将提取的网页内容格式化为 AI 友好的格式,便于后续处理。
我们实验了Dify平台上的许多搜索及网页内容读取插件,此插件最大的不同是基于AI视觉识别来实现的搜索,并排除了许多无用的网页干扰元素,搜索结果上更加准确实时。
详细配置步骤
步骤 1:创建 Dify 应用
- 登录 Dify 平台
- 创建新的应用,选择"chatflow"模式
- 配置应用基本信息(名称、图标等)
步骤 2:配置工作流节点
2.1 添加时间获取节点
- 节点类型:工具
- 工具选择:获取当前时间
- 配置格式:YYYY-MM-DD
- 时区设置:UTC
2.2 添加搜索节点
- 节点类型:工具
- 工具选择:网页搜索
- 参数配置:搜索关键词绑定到用户输入
- 返回条数:默认 10 条
2.3 添加代码处理节点
def main(response): results = response[0].get("webPages", []) urls = [] for item in results[:5]: urls.append(item.get("url")) return {"results": urls}
2.4 配置迭代器
- 迭代类型:数组迭代
- 输入:URL 数组
- 并行处理:启用(提高效率)
- 并行数量:10
2.5 添加网页读取节点
- 节点类型:工具
- 工具选择:网页阅读器
- 参数:URL 来自迭代器当前项
- 超时设置:根据网络情况调整
2.6 配置内容格式化
节点类型:模板转换 模板格式:[webpage {{ i+1 }} begin]{{ text }}[webpage {{ i+1 }} end] 变量绑定:文本内容和索引
步骤 3:配置 LLM 模型
3.1 选择模型
- 模型:DeepSeek Chat
- 提供商:langgenius/deepseek
- 温度:0.7(平衡创造性和准确性)
3.2 提示词模板
# 以下内容是基于用户发送的消息的搜索结果: {{context}} 在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X 代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号<a href="网页链接">X</a>的格式在答案中对应部分引用上下文。 在回答时,请注意以下几点: - 今天是 {{today}}。 - 并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。 - 对于列举类的问题,尽量将答案控制在 10 个要点以内。 - 对于创作类的问题,请务必在正文的段落中引用对应的参考编号。 - 如果回答很长,请尽量结构化、分段落总结。 - 你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。 - 你的回答应该综合多个相关网页来回答,不能重复引用一个网页。 - 除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。 # 用户消息为: {{#sys.query#}}
步骤 4:连接节点
核心特性分析
使用效果展示
示例 1:实时信息查询
用户问题:今天北京的天气怎么样?
系统处理:
- 获取当前时间
- 搜索"今天北京天气"
- 提取相关网页 URL
- 读取天气网站内容
- AI 整合信息并回答
示例 2:技术问题解答
用户问题:最新的 Python 3.12 有什么新特性?
系统处理:
- 搜索"Python 3.12 新特性"
- 获取官方文档和技术博客
- 提取核心信息
- AI 总结并结构化回答
后续可扩展优化
技术要点总结
- 模块化设计:每个功能模块独立,便于维护和扩展
- 错误处理:完善的错误处理机制,确保系统稳定性
- 可配置性:关键参数可配置,适应不同使用场景
- 扩展性:支持添加更多搜索源和内容处理方式
结语
通过 Dify 平台搭建联网搜索助手,我们不仅实现了 AI 的实时信息获取能力,更重要的是建立了一个可扩展、可维护的智能问答系统。这种方案相比传统的本地部署更加稳定可靠,同时提供了丰富的配置选项和优化空间。
随着 AI 技术的不断发展,联网搜索能力将成为智能助手的基础功能。通过本文的介绍,相信您已经掌握了构建这类系统的核心思路和实现方法。期待看到更多基于此方案的创新应用!
本文基于 Dify 平台实际配置经验编写,所有代码和配置均经过测试验证。如有疑问,欢迎交流讨论