拒绝等待!阿里云瑶池数据库 x Qwen3,构建增强式RAG

本文涉及的产品
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
简介: 阿里巴巴发布的通义千问Qwen3在性能上超越多个国际顶尖模型,阿里云瑶池数据库已适配该模型,支持私域部署并与Dify无缝集成。传统RAG方案在处理复杂关系和多跳推理时存在局限,而GraphRAG通过图结构存储知识,结合Qwen3和AnalyticDB PostgreSQL,可有效解决这些问题,提升知识关联检索与分析能力。某新零售客户案例表明,GraphRAG能更好地满足高复杂度业务需求,提供直观的知识图谱可视化服务。阿里云提供Qwen3全系列模型的私域部署解决方案,确保数据安全和服务稳定性。

01 引言

日前,阿里巴巴正式发布通义千问Qwen3并登顶全球开源大模型王座,性能全面超越DeepSeek-R1和OpenAI o1,横扫各大基准测试榜单。

此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

阿里云瑶池数据库现已适配 Qwen3 模型,支持在 DMS+AnalyticDB 上进行私域部署,并与 Dify 无缝集成。用户可以通过 Dify on DMS 快速启用 Qwen3 模型,实现开箱即用,并结合 AnalyticDB GraphRAG 能力突破传统 RAG 的局限,实现高复杂场景下的知识关联检索与分析。


02 传统RAG方案的不足

1.png

RAG 通过结合知识库提升内容生成的质量,其流程包括三个主要步骤:

  1. 索引:利用 Embedding 模型将文档分块转化为向量,并存储在向量数据库中。
  2. 检索:将查询转化为向量,通过相似性算法在向量数据库中查找相关上下文文档。
  3. 生成:将查询和检索到的上下文文档输入到大型模型中,以生成高质量的结果。


这种方法有效结合了模型内部知识和外部知识库,特别适用于知识密集型任务,提高了生成内容的准确性和可信度。RAG 还可以结合提示词工程、模型微调和知识图谱,形成更广泛的问答链。然而,传统 RAG 在处理复杂关系、多跳推理和知识关联等场景时存在一定局限性

  • 上下文理解不足:难以深度理解文本中实体间的复杂关系,影响回答的准确性。
  • 信息筛选不佳:难以区分关键信息与冗余信息,导致使用无效内容或噪声。
  • 查询意图不明确:查询过于笼统或含歧义时,影响向量和模型的准确性。


03 基于 Qwen3+AnalyticDB+Dify on DMS 构建一站式GraphRAG服务


22.png


与传统 RAG 不同,GraphRAG 是通过图来保存文本知识中实体之间的联系。通过将文本抽象为图数据,知识图显著简化了输入文本,减少冗长问题。GraphRAG 从预先构建的图数据库中检索与查询相关的图元素,如节点、三元组、路径或子图。通过检索子图或图社区,GraphRAG 能够捕捉更广泛的上下文和联系,有效应对 QFS 挑战。构建一个完整的 GraphRAG 业务,需要三个重要的子系统:知识图谱理解抽取系统、基于向量与图的 GraphRAG 引擎系统、支持RAG的AI工程框架。


阿里云瑶池 DMS+AnalyticDB 支持私域部署大模型,Dify+Qwen3模型在同一专有网络(VPC)内部署,通过客户自购资源部署和专有网络联通使用,数据不出域,安全有保障,服务更稳定!通过结合 Dify on DMS + Qwen3 + AnalyticDB PostgreSQL,可以实现高效安全的 GraphRAG 业务应用。


知识图谱理解与抽取

知识图谱系统用于实现知识建模和抽取。最新的阿里通义千问 Qwen3 在文档理解、数据抽取、问题分析、多语言识别等方面表现优异,它的参数量仅为DeepSeek-R1的1/3,但成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型。我们利用通义千问Qwen3,完成对文本的分析并进行实体和关系的三元组抽取,从而构建相应的知识图谱。


GraphRAG 引擎

相比传统 RAG,结合向量和图的 GraphRAG 能更高效地处理大规模知识的关联检索与分析。阿里云瑶池旗下的云原生数据仓库AnalyticDB PostgreSQL(以下简称ADB PG)作为一款具备 GraphRAG 引擎的MPP数据库,它具备完整的事务处理、高吞吐写入和流批一体引擎以及提供关系型数据存储、全文、向量存储和图数据存储功能,显著简化应用构建的过程,提供精准分析和决策支持。通过整合 Qwen3 的知识抽取能力和 AnalyticDB PostgreSQL 的图引擎优势,GraphRAG 可以实现更全面的上下文理解和信息检索,优化业务流程。


Data Agent LLMOps 平台

AI框架作为业务层的"智能中枢",负责协调数据流转、模型调度和结果生成,实现从原始数据到智能服务的端到端闭环。Dify on DMS是阿里云瑶池数据库基于Data+AI驱动的数据管理平台DMS推出的一站式AI应用部署解决方案。通过DMS可以轻松将Dify应用部署到阿里云上,并与通义大模型和瑶池数据库生态等无缝融合。无论是数据处理、模型训练,还是AI应用的快速上线,DMS都能提供低门槛、开箱即用的体验,构建企业级安全稳定的Data+AI平台。目前已经支持Qwen3的全家族模型部署。


3.png

 

目前,DMS LLMOps平台累计支持了超100+客户实现端到端的企业级Agent平台搭建,结合AnalyticDB增强RAG能力构建Data Agent,并提供所需要的全链路管理能力,实现从一键部署平台+模型、模型管理、应用编排等核心能力;现已全网发布支持Qwen3的全家族模型部署,可立即开通使用。


4.png


04 案例介绍:某头部新零售客户

5.png

某头部新零售客户在使用RAG构建知识问答系统的过程中,发现传统向量RAG系统难以处理复杂关系、多跳推理和知识关联的查询。这导致结果不够准确,无法满足其高复杂度的业务需求。例如在一个典型的多跳推理的问答,“我有A场景的需求,你能推荐几个功能以及相关的指标么?”。在传统基于向量的RAG检索过程中,由于业务文档只有产品与场景需求的对应关系,因此只通过向量搜索无法完成场景 -> 产品 -> 功能 -> 指标的多跳推理来正确回答用户的问题,GraphRAG就能解决这个问题。


首先GraphRAG对用户业务文档中的实体关系进行抽象,转换为知识图谱并将知识图谱持久化至图引擎中。然后通过大模型对于用户问题的关键词提炼,能够得到场景,功能,指标这些实体关键字,然后根据问题中的关键字检索知识图谱,这样能够最终得到用户想要的回答。而ADB PG由于同时具备向量与图的检索能力,因此,此客户选择基于DMS+LLM+ADB PG的GraphRAG,以克服传统RAG的局限性,增强了复杂信息处理能力。同时,使用GraphRAG也可以通过知识图谱的可视化能力,让业务方能够更加直观地获取数据信息和拓扑关系,提升服务效率。


如何部署Qwen3

详细部署步骤请参考👇

https://developer.aliyun.com/article/1656021


05 总结

阿里云瑶池 Dify on DMS + AnalyticDB 现已支持通义千问 Qwen3 全系列模型的私域部署,并提供独占模型服务,实现高效安全的 GraphRAG 业务应用及大模型应用开发解决方案。数据不出域,安全有保障,服务更稳定!如果您有相关部署需求,欢迎钉钉搜索群号:96015019923 or 扫码入群交流。

6.png

相关文章
|
1月前
|
程序员 定位技术 开发者
试了试阿里云的通义灵码 2.5 版
通义灵码 2.5 版是个特别实用的工具,无论是个人开发者还是企业团队,都能从中受益。如果你也在找能提升开发效率的工具,通义灵码绝对值得一试!
102 33
试了试阿里云的通义灵码 2.5 版
|
1月前
|
人工智能 自然语言处理 数据挖掘
云上玩转Qwen3系列之三:PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用
PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用,通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。
|
21天前
|
人工智能 数据挖掘 API
基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
145 21
基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
|
22天前
|
Java 数据库 Docker
基于neo4j数据库和dify大模型框架的rag模型搭建
基于neo4j数据库和dify大模型框架的rag模型搭建
241 35
|
1月前
|
人工智能 自然语言处理 机器人
阿里云百炼xWaytoAGI共学课 DAY4 - 小白也能在阿里云百炼手搓Qwen3,构建Qwen3赋能的英语学习智能体“妮娜”
本次课程通过构建"英语老师妮娜"AI应用,教授Qwen3系列模型特性及阿里云百炼平台的MCP服务、工作流集成技术。重点学习模型选择、智能体开发流程,涵盖单词卡片生成、结构化分析、Notion存档及二维码分享功能,适合开发者、产品经理等人群掌握AI应用落地方法。
|
19天前
|
弹性计算 自然语言处理 Ubuntu
从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人
本文描述在阿里云上从0开始构建一个LLM智能问答钉钉机器人。LLM直接调用了阿里云百炼平台提供的调用服务。
从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人
|
24天前
|
人工智能 测试技术 API
通义灵码 + 魔搭MCP:全流程构建创空间应用
最近,通义灵码上线 MCP(ModelScope Cloud Platform)功能,从之前代码生成及修改的基础功能,到可以使用MCP服务连接更多功能,开发者可以实现从 代码爬取、模型推理到应用部署
421 26
|
20天前
|
人工智能 关系型数据库 分布式数据库
媒体声音|从亚太到欧美,阿里云瑶池数据库凭何成为中企出海的技术底气?
在中企出海的时代浪潮中,瑶池数据库正凭借其技术创新、场景化解决方案、智能化能力、全球化布局,成为企业跨越挑战、构建全球竞争力的关键伙伴;同时也以硬核的技术实力证明了中国数据库的国际竞争力。
|
21天前
|
存储 机器学习/深度学习 人工智能
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。
200 0
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
|
26天前
|
安全 Apache 数据库
【倒计时3天】NineData x Apache Doris x 阿里云联合举办数据库技术Meetup,5月24日深圳见!
5月24日,NineData联合Apache Doris与阿里云在深圳举办数据库技术Meetup。活动聚焦「数据实时分析」与「数据同步迁移」两大领域,邀请行业专家分享技术趋势、产品实践及解决方案,助力企业构建高效安全的数据管理体系。时间:14:00-17:30;地点:深圳新一代产业园2栋20楼会议室。线下名额有限(80人),速报名参与深度交流!
45 1

热门文章

最新文章