云上玩转DeepSeek系列之三:PAI-RAG集成联网搜索,构建企业级智能助手

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 本文将为您带来“基于 PAI-RAG 构建 DeepSeek 联网搜索+企业级知识库助手服务”解决方案,PAI-RAG 提供全面的生态能力,支持一键部署至企业微信、微信公众号、钉钉群聊机器人等,助力打造多场景的AI助理,全面提升业务效率与用户体验。

DeepSeek 系列模型以卓越性能在全球范围内备受瞩目,在各类评测中表现优异,推理性能接近甚至超越国际顶尖闭源模型。2025年2月以来,阿里云人工智能平台 PAI 持续推出围绕 DeepSeek 系列模型的最佳实践,包含快速部署、应用搭建、蒸馏、微调等各个环节,让企业和个人开发者可以在云上高效、灵活地部署和探索 DeepSeek-R1、DeepSeek-V3 等模型。

本文将为您带来“基于 PAI-RAG 构建 DeepSeek 联网搜索+企业级知识库助手服务”解决方案。目前,PAI-RAG 提供全面的生态能力,支持一键部署至企业微信、微信公众号、钉钉群聊机器人等,助力打造多场景的AI助理,全面提升业务效率与用户体验。

一、PAI-RAG 构建 DeepSeek 联网搜索+企业级知识库助手服务

在日常对话中,联网搜索功能至关重要,它能够追踪实时热点、获取最新数据,成为您24小时在线的专属 AI 情报员。

PAI-RAG 支持灵活配置“联网搜索”能力,轻松访问和利用实时数据,获得更加精准、全面的搜索结果,让模型突破预训练数据的时间边界,提供时效精准的智能问答服务,全面提升AI应用的效能与可靠性。

“联网搜索”使用了阿里云通用搜索服务 API 接口,具备实时性强、准确性高、易用性好等特点。无论您是企业用户还是个人开发者,PAI-RAG 都为您打造了一个强大而灵活的 AI 搜索解决方案,助力实现智能化目标。

Step1:通过 PAI-EAS 场景化部署大模型 RAG 对话系统

  • 进入 EAS 控制台,点击“部署服务”,选择“部署大模型 RAG 对话系统”。
  • PAI-RAG 支持两种部署方式:LLM 一体化部署会将 LLM 和 RAG 部署在同一 EAS 服务内,操作更加简单;LLM 分离式部署仅会部署 RAG 服务,在 RAG 服务中可以自由连接模型服务,灵活性更高。
  • 本文以 DeepSeek-R1-Distill-Qwen-32B 为例,实现 RAG+LLM 一体化部署。

image.png

Step2: 开通网络搜索服务

image.png

Step3:在 RAG 应用中配置网络搜索功能

  • RAG 服务部署好之后,打开 WebUI 页面,配置联网搜索功能。
  • 搜索引擎选择“阿里云”,表示阿里云的网络搜索服务,填写搜索个数、服务地址、AccessKey 和 AccessSecret。
  • 聊天方式选择“Chat(Web Search)”

image.png

Step4:实时联网搜索对话测试

  1. 联网搜索效果展示:

image.png

  1. 不联网回复效果对比:

image.png


二、PAI-RAG 更多企业级能力

1. 私域知识库问答

企业用户还可以上传私域知识,借助平台的 RAG 能力,让 DeepSeek 大模型“更懂”自身的知识。基于 LLM+RAG 的技术框架,PAI-RAG 提供了多模态、OCR、文本 embedding、多路检索召回、重排等能力,来解决知识处理与答案生成的全链路难点,帮助企业更快速、准确地使用大模型搭建RAG应用,提升服务准确度和效率。

image.png

2. 多模态检索&对话

支持多模态文档的智能解析,集成多模态检索算法,提供多模态的图文回复。

image.png

3. Agentic RAG

支持内置工具、自定义 API 工具(查询库存,订单信息)和自定义代码工具,支持多意图分发(检索、工具调用、数据库查询、网络搜索)

image.png

4. 数据库问答

对接已有数据库,根据数据库信息自动生成查询、选表选列算法、值检索、查询历史检索、SQL 错误自动修复

5. OpenAI 接口兼容

支持标准 OpenAI 兼容接口,无缝对接各种支持 OpenAI 接口的应用,可以完美对接OpenWebUI,Chatbox,AnythingLLM, Cherry Studio 等大语言模型服务商的客户端,兼容 Windows、Mac 和 Linux 系统。

6. 生态无缝对接

PAI-RAG 已支持企业微信、微信公众号和钉钉群聊机器人三种生态模式,轻松实现一键部署 PAI-RAG 并无缝对接生态应用。

7. 内容安全过滤

接入内容安全过滤,为企业用户提供稳定、即接即用、成熟的内容安全解决方案,帮助企业和开发者在复杂多变的互联网环境下快速发现文本、图片等各类风险,提高内容质量和用户体验。

8. 支持服务弹性扩缩容和多实例部署

在业务负载出现显著的波峰波谷时,提供自动扩缩容功能。服务能够自动调整实例数量,实现动态管理线上服务的计算资源,从而保障业务平稳运行并提高资源利用率。

9. Tracing 链路追踪

在部署服务时增加链路追踪功能,为 LLM 应用提供高质量的埋点能力,并自动上报链路数据。每次调用服务,系统会在链路追踪页签自动生成一条 Trace 记录,进一步通过 Trace 数据来评估模型效果。

image.png


三、相关产品 wiki

1. PAI-RAG 是开箱即用的模块化 RAG 开源框架,结合 LLM 的知识推理能力,为 PAI 的企业用户提供生产级的 RAG 能力。

PAI-RAG 的亮点特性有:

  • 丰富的 RAG 功能:提供文档解析、拆分、embedding、多轮对话、Query 改写、FunctionCalling、自动化评估、内容安全、链路追踪等多项原子能力,各模块支持灵活配置和定制开发。
  • 全面的企业级能力:前后端采用 Kubernetes 部署,支持自动容错、弹性扩缩容、请求队列等企业级能力。
  • 简单易用的管控台:通过 EAS 场景化部署,支持分钟级快捷搭建应用,轻松实现一键部署专属 AI 助手。
  • 灵活的大模型选择:用户可以根据自身需求选择大模型,通过 Model Gallery 部署模型服务,在 PAI-RAG 中一键接入各种模型。

项目开源地址:https://github.com/aigc-apps/PAI-RAG

image.png

PAI-RAG 管控台如图:

image.png

2. PAI Model Gallery 集成了国内外 AI 开源社区中优质的预训练模型,提供了 BladeLLM、SGLang 和 vLLM 加速部署功能,帮助您一键部署 DeepSeek-V3 和DeepSeek-R1系列模型。PAI-RAG 支持无缝接入 Model Gallery 部署的模型。

image.png

3. 阿里云信息查询服务-通用搜索是专为大模型时代打造最先进的开放域搜索解决方案,提供强大的实时搜索能力,助力大模型应用实现高效、精准的实时问答。PAI-RAG 已实现对阿里云通用搜索服务的集成,实现了 LLM 与联网搜索的无缝对接,使用户能够稳定、高效地实时获取最新信息。


PAI-RAG 最佳实践系列

  1. 大模型RAG对话系统
  2. RAG集成联网搜索搭建AI智能问答最佳实践
  3. 基于EAS&Elasticsearch搭建RAG检索增强对话系统
  4. 基于EAS&Milvus搭建RAG检索增强对话系统
  5. 基于EAS&RDS PostgreSQL搭建RAG检索增强对话系统
  6. 基于EAS&OpenSearch搭建RAG检索增强对话系统
  7. 基于AppFlow集成钉钉与PAI RAG构建AI机器人指南
  8. 基于AppFlow集成微信公众号与PAI RAG构建智能客服
  9. 基于AppFlow集成企业微信与PAI RAG构建AI助手


联系我们

image.png



相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
19天前
|
人工智能
活动速递 | 解锁企业AI-轻松掌握无缝集成DeepSeek、Qwen-Max
活动速递 | 解锁企业AI-轻松掌握无缝集成DeepSeek、Qwen-Max
活动速递 | 解锁企业AI-轻松掌握无缝集成DeepSeek、Qwen-Max
|
20天前
|
人工智能 运维 数据可视化
1分钟集成DeepSeek满血版!搭建智能运维助手
阿里云 AI 搜索开放平台面向企业及开发者提供丰富的组件化AI搜索服务,本文将重点介绍基于AI搜索开放平台内置的 DeepSeek-R1 系列大模型,如何搭建 Elasticsearch AI Assistant。
479 170
1分钟集成DeepSeek满血版!搭建智能运维助手
|
27天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课15 集成DeepSeek等大模型
本文介绍了如何在PolarDB数据库中接入私有化大模型服务,以实现多种应用场景。实验环境依赖于Docker容器中的loop设备模拟共享存储,具体搭建方法可参考相关系列文章。文中详细描述了部署ollama服务、编译并安装http和openai插件的过程,并通过示例展示了如何使用这些插件调用大模型API进行文本分析和情感分类等任务。此外,还探讨了如何设计表结构及触发器函数自动处理客户反馈数据,以及生成满足需求的SQL查询语句。最后对比了不同模型的回答效果,展示了deepseek-r1模型的优势。
88 0
|
26天前
|
存储 人工智能 测试技术
小鱼深度评测 | 通义灵码2.0,不仅可跨语言编码,自动生成单元测试,更炸裂的是集成DeepSeek模型且免费使用,太炸裂了。
小鱼深度评测 | 通义灵码2.0,不仅可跨语言编码,自动生成单元测试,更炸裂的是集成DeepSeek模型且免费使用,太炸裂了。
141100 24
小鱼深度评测 | 通义灵码2.0,不仅可跨语言编码,自动生成单元测试,更炸裂的是集成DeepSeek模型且免费使用,太炸裂了。
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
云上一键部署通义千问 QwQ-32B 模型,阿里云 PAI 最佳实践
3月6日阿里云发布并开源了全新推理模型通义千问 QwQ-32B,在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,性能比肩Deepseek-R1,且部署成本大幅降低。并集成了与智能体 Agent 相关的能力,够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署 QwQ-32B,本实践带您部署体验专属 QwQ-32B模型服务。
|
15天前
|
人工智能 自然语言处理 API
Hologres × PAI × DeepSeek 搭建 RAG 检索增强对话系统
本文介绍如何使用PAI-EAS部署基于DeepSeek大模型的RAG(检索增强生成)服务,并关联Hologres引擎实例。Hologres与阿里云自研高性能向量计算软件库Proxima深度整合,支持高性能、低延时的向量计算能力。通过PAI-EAS,用户可以一键部署集成了大语言模型和RAG技术的对话系统服务,显著缩短部署时间,并提高问答质量。部署步骤包括准备Hologres向量检索库、部署基于DeepSeek的RAG服务、通过WebUI进行模型推理验证,以及通过API调用进行模型推理验证。Hologres还提供了特色功能支持,如高性能向量计算等。
|
24天前
|
人工智能 IDE 测试技术
用户说 | 通义灵码2.0,跨语言编码+自动生成单元测试+集成DeepSeek模型且免费使用
通义灵码, 作为国内首个 AI 程序员,从最开始的内测到公测,再到通义灵码正式发布第一时间使用,再到后来使用企业定制版的通义灵码,再再再到现在通义灵码2.0,我可以说“用着”通义灵码成长的为数不多的程序员之一了吧。咱闲言少叙,直奔主题!今天,我会聊一聊通义灵码的新功能和通义灵码2.0与1.0的体验感。
|
24天前
|
人工智能 自然语言处理 搜索推荐
阿里云 AI 搜索开放平台集成 DeepSeek 模型
阿里云 AI 搜索开放平台最新上线 DeepSeek -R1系列模型。
|
1月前
|
人工智能 自然语言处理 网络安全
基于阿里云 Milvus + DeepSeek + PAI LangStudio 的低成本高精度 RAG 实战
阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。
|
20天前
|
人工智能 运维 数据可视化
1分钟集成DeepSeek满血版!搭建智能运维助手
1分钟集成DeepSeek满血版!搭建智能运维助手

热门文章

最新文章

相关产品

  • 人工智能平台 PAI