自建 DeepSeek 时代已来,联网搜索如何高效实现

本文涉及的产品
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
云原生网关 MSE Higress,422元/月
任务调度 XXL-JOB 版免费试用,400 元额度,开发版规格
简介: 随着 DeepSeek 等高质量开源大模型的涌现,企业自建智能问答系统的成本已降低 90% 以上。基于 7B/13B 参数量的模型在常规 GPU 服务器上即可获得商业级响应效果,配合 Higress 开源 AI 网关的增强能力,开发者可快速构建具备实时联网搜索能力的智能问答系统。

作者:张添翼(澄潭)


01 开源 LLM 的新纪元:DeepSeek 带来的技术平权


随着 DeepSeek 等高质量开源大模型的涌现,企业自建智能问答系统的成本已降低 90% 以上。基于 7B/13B 参数量的模型在常规 GPU 服务器上即可获得商业级响应效果,配合 Higress 开源 AI 网关的增强能力,开发者可快速构建具备实时联网搜索能力的智能问答系统。

02

02 Higress:零代码增强 LLM 的瑞士军刀


Higress 作为云原生 API 网关,通过 wasm 插件提供开箱即用的 AI 增强能力:

image.png

主要能力矩阵:

  • 联网搜索:实时接入互联网最新信息
  • 智能路由:多模型负载均衡与自动兜底
  • 安全防护:敏感词过滤与注入攻击防御
  • 效能优化:请求缓存+token 配额管理
  • 可观测性:全链路监控与审计日志


03 联网搜索的技术实现与场景价值


Higress AI 搜索增强插件代码已经开源,可以点击此处查看插件文档和代码。


核心架构解析

image.png

关键技术特性

1. 多引擎智能分流

  • 公共搜索(Google/Bing/Quark)获取实时资讯
  • 学术搜索(Arxiv)对接科研场景
  • 私有搜索(Elasticsearch)连接企业/个人知识库

2. 搜索增强核心思路

  • LLM 重写 Query:基于 LLM 识别用户意图,生成搜索命令,可以大幅提升搜索增强效果
  • 关键词提炼:针对不同的引擎,需要生成不同的提示词,例如 Arxiv 里英文论文居多,关键词需要用英文
  • 领域识别:仍以 Arxiv 举例,Arxiv 划分了计算机科学/物理学/数学/生物学等等不同学科下的细分领域,指定领域进行搜索,可以提升搜索准确度
  • 长查询拆分:长查询可以拆分为多个短查询,提高搜索效率
  • 高质量数据:Google/Bing/Arxiv 搜索都只能输出文章摘要,而基于阿里云信息检索对接 Quark 搜索,可以获取全文,可以提高 LLM 生成内容的质量


典型应用场景效果展示

金融资讯问答

image.png

前沿技术探索

image.png

image.png

医疗问题解答

image.png

image.png


04 从开源到落地:三步构建智能问答系统


1. 基础部署


# 一行命令安装并启动Higress网关
curl -sS  https://higress.cn/ai-gateway/install.sh | bash

# 用vllm部署DeepSeek-R1-Distill-Qwen-7B示意
python3 -m vllm.entrypoints.openai.api_server --model=deepseek-ai/DeepSeek-R1-Distill-Qwen-7B --dtype=half --tensor-parallel-size=4 --enforce-eager


2. 插件配置

可以通过 http://127.0.0.1:8001 访问 higress 控制台,给 ai-search 插件做如下配置。


plugins:
searchFrom:
- type: quark
  apiKey: "your-aliyun-ak"
  keySecret: "your-aliyun-sk"
  serviceName: "aliyun-svc.dns"
  servicePort: 443
- type: google
  apiKey: "your-google-api-key"
  cx: "search-engine-id"
  serviceName: "google-svc.dns"
  servicePort: 443
- type: bing
  apiKey: "bing-key"
  serviceName: "bing-svc.dns"
  servicePort: 443
- type: arxiv
  serviceName: "arxiv-svc.dns" 
  servicePort: 443
searchRewrite:
  llmServiceName: "llm-svc.dns"
  llmServicePort: 443
  llmApiKey: "your-llm-api-key"
  llmUrl: "https://api.example.com/v1/chat/completions"
  llmModelName: "deepseek-chat"
  timeoutMillisecond: 15000


3. 对接 SDK 或前端

使用这个 OpenAI 协议 BaseUrl:http://127.0.0.1:8080/v1,就可以使用 ChatBox/LobeChat 等支持 OpenAI 协议的对话工具进行对话。


也可以直接使用 OpenAI 的 SDK 对接,如下所示:


import json
from openai import OpenAI

client = OpenAI(
    api_key="none",
    base_url="http://localhost:8080/v1",
)

completion = client.chat.completions.create(
    model="deepseek-r1",
    messages=[
        {"role": "user", "content": "分析一下国际金价走势"}
    ],
    stream=False
)

print(completion.choices[0].message.content)


通过 Higress+DeepSeek 的开源组合,企业可在 24 小时内完成从零到生产级的智能问答系统部署,使 LLM 真正成为业务增长的智能引擎。

相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
相关文章
|
16天前
|
人工智能 自然语言处理 算法
阿里云 AI 搜索开放平台:从算法到业务——AI 搜索驱动企业智能化升级
本文介绍了阿里云 AI 搜索开放平台的技术的特点及其在各行业的应用。
111 3
|
12天前
|
人工智能 自然语言处理 搜索推荐
阿里云 AI 搜索开放平台新功能发布:大模型联网能力上线
阿里云 AI 搜索开放平台此次新增了大模型联网能力,通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。
233 25
|
1月前
|
自然语言处理 搜索推荐 前端开发
大模型联网搜索的短板与突破之路
本文作者详细分析了当前大模型在联网搜索功能中存在的几个主要问题,并提供了具体的案例和解决方案。
大模型联网搜索的短板与突破之路
|
2月前
|
存储 人工智能 运维
内附源码|头部基模企业信赖之选——DMS+Lindorm智能搜索方案
内附源码|头部基模企业信赖之选——DMS+Lindorm智能搜索方案
|
2月前
|
人工智能 自然语言处理 搜索推荐
云上玩转DeepSeek系列之三:PAI-RAG集成联网搜索,构建企业级智能助手
本文将为您带来“基于 PAI-RAG 构建 DeepSeek 联网搜索+企业级知识库助手服务”解决方案,PAI-RAG 提供全面的生态能力,支持一键部署至企业微信、微信公众号、钉钉群聊机器人等,助力打造多场景的AI助理,全面提升业务效率与用户体验。
|
2月前
|
人工智能 缓存 自然语言处理
自建 DeepSeek 时代已来,联网搜索如何高效实现
自建 DeepSeek 时代已来,联网搜索如何高效实现
|
3月前
|
存储 人工智能 自然语言处理
|
2月前
|
存储 人工智能 自然语言处理
Lindorm作为AI搜索基础设施,助力Kimi智能助手升级搜索体验
Lindorm作为AI搜索基础设施,助力Kimi智能助手升级搜索体验
|
4月前
|
机器学习/深度学习 人工智能 搜索推荐
DeepSeek-V2.5-1210 在线开放使用!支持联网搜索,在各大领域的表现得到全面提升
DeepSeek-V2.5-1210 是 DeepSeek V2.5 系列的最终版微调模型,支持联网搜索功能,具备在数学、编程、写作和角色扮演等领域的能力提升。本文将详细介绍该模型的功能、技术原理及应用场景。
9938 19
DeepSeek-V2.5-1210 在线开放使用!支持联网搜索,在各大领域的表现得到全面提升
|
6月前
|
自然语言处理 搜索推荐 数据可视化
合合信息开源智能文档处理“百宝箱”:加速、提质、个性化定制的高效助手
随着AI技术的发展,合合信息在CSDN 1024程序员节上发布了智能文档处理“百宝箱”,旨在解决文档处理中的非结构化文本提取难题。该工具集包括可视化文档解析前端TextIn ParseX、高精度向量化模型acge-embedding及文档解析测评工具markdown_tester,广泛适用于知识库构建、智能文档抽取、预训练语料管理等场景,助力开发者高效精准处理复杂文档。
234 0
合合信息开源智能文档处理“百宝箱”:加速、提质、个性化定制的高效助手
下一篇
oss创建bucket