从“听指令”到“当参谋”,阿里云AnalyticDB GraphRAG如何让AI开窍

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
云原生数据库 PolarDB MySQL 版,通用型 2核8GB 50GB
简介: 阿里云瑶池旗下的云原生数据仓库 AnalyticDB PostgreSQL 版 GraphRAG 技术,创新融合知识图谱动态推理+向量语义检索,通过实体关系映射与多跳路径优化,构建可应对复杂场景的决策引擎。本文将通过家电故障诊断和医疗预问诊两大高价值场景,解析其如何实现从“被动应答”到“主动决策”的跨越。

01、背景

在智能客服与医疗问诊领域,用户模糊描述导致的多轮对话断裂与语义关联缺失,长期阻碍决策效率提升。传统 RAG 技术面临双重困境:


  • 单轮检索局限:当用户仅反馈“空调制冷效果差”、“持续发热三天”等模糊信息时,传统 RAG 缺乏追问能力,无法定位根因;
  • 语义跳跃失控:对话中突然切换话题(如患者从“咳嗽”转向“头痛”)时,传统方案因无法关联跨域知识导致误判。


阿里云瑶池旗下的云原生数据仓库 AnalyticDB PostgreSQL 版 GraphRAG 技术,创新融合知识图谱动态推理+向量语义检索,通过实体关系映射与多跳路径优化,构建可应对复杂场景的决策引擎。本文将通过家电故障诊断和医疗预问诊两大高价值场景,解析其如何实现从“被动应答”到“主动决策”的跨越。

02、GraphRAG 业务系统

相比传统 RAG,结合向量和图的 GraphRAG 能更高效地处理大规模知识的关联检索与分析。GraphRAG 是通过图来保存文本知识中实体之间的联系。通过将文本抽象为图数据,知识图显著简化了输入文本,减少冗长问题。通过检索子图或图社区,GraphRAG 能够捕捉更广泛的上下文和联系,有效应对 QFS 挑战。


构建一个完整的 GraphRAG 业务,需要三个重要的子系统:知识图谱理解抽取系统、 GraphRAG 引擎系统、支持 RAG 的 AI 工程框架。

image.png

1、知识图谱理解与抽取

知识图谱系统用于实现知识建模和抽取。最新的阿里通义千问 Qwen3 在文档理解、数据抽取、问题分析、多语言识别等方面表现优异,成本大幅下降,性能全面超越DeepSeek-R1、OpenAI-o1等全球顶尖模型。我们利用通义千问 Qwen3,完成对文本的分析并进行实体和关系的三元组抽取,从而构建相应的知识图谱。


2、GraphRAG 引擎

阿里云瑶池旗下的云原生数据仓库AnalyticDB PostgreSQL(以下简称ADB PG)作为一款具备 GraphRAG 引擎的MPP数据库,它具备完整的事务处理、高吞吐写入和流批一体引擎以及提供关系型数据存储、全文、向量存储和图数据存储功能,显著简化应用构建的过程,提供精准分析和决策支持。通过整合 Qwen3 的知识抽取能力和 AnalyticDB PostgreSQL 的图引擎优势,GraphRAG 可以实现更全面的上下文理解和信息检索,优化业务流程。


3、Data Agent Platform

AI框架作为业务层的"智能中枢",负责实现从原始数据到智能服务的端到端闭环。Dify on DMS是阿里云瑶池数据库推出的一站式AI应用部署解决方案。通过DMS可以轻松将Dify应用部署到阿里云上,并与通义大模型和瑶池数据库生态等无缝融合。无论是数据处理、模型训练,还是AI应用的快速上线,DMS都能提供低门槛、开箱即用的体验,构建企业级安全稳定的Data+AI平台。

03、ADB PG GraphRAG技术解析

image.png

知识图谱的构建和导入

▶︎ 图谱构建

知识图谱构建是一个融合多源数据、自然语言处理(NLP)技术和图数据库管理的系统性工程,ADB PG GraphRAG 通过生成式模型将原始文本转换为图谱的“节点(实体)”和“边(关系)”,其核心流程包括:


对文本进行chunk并从中抽取实体属性(如“特斯拉CEO:马斯克”) → 解决实体同名歧义(如“鹅厂→腾讯”)与数据冗余问题 → 节点去重与实体归一化处理 → 将抽取到的节点转换为Cypher语句写入ADB PG图存储 → 同步将chunk生成文本向量存入ADB PG向量库中。


如此,用户在查询的时候既可以通过embedding进行语义相似度搜索,也可以通过知识图谱搜索正确的回答,大大提升回答的准确度。


▶︎ 图谱融合

针对跨文献抽取实体时出现的命名差异问题(如“鹅厂”与“腾讯”指向同一实体),ADB PG GraphRAG采用分层消歧策略:


支持领域专家自定义映射规则(例如强制将“计算机”标准化为“电脑”),实现基础术语统一;其次利用公共样本库执行聚类分析,自动归集同义实体(如合并“北医三院”与“北京大学第三医院”);对于复杂歧义场景,则调用大语言模型进行深度语义匹配。通过规则定义、数据驱动聚类和AI模型协同,图谱融合能够有效消除实体歧义,为精准检索奠定基础。

知识图谱的检索增强

▶︎ 关联检索

当用户发起查询时,关联检索首先抽取问题中的实体关系,沿知识图谱检索相邻N跳节点的语义内容,通过相似度匹配定位最相关节点及对应文本块,显著提升多跳问题的准确性与可解释性。


▶︎ 全局检索

若检测到对话跳跃现象:包括语义突变或跨领域提问,系统会自动触发全局检索,将用户问题转化为向量后执行全图搜索,快速定位Top-N相似节点,并结合会话上下文重定位对话路径,提升回答的准确度。


▶︎ 多路检索召回

结合“关联检索”和“全局检索”的两个能力,ADB PG GraphRAG服务还提供了多路检索的自适应召回能力,同步计算关联检索与全局检索的置信度,默认优先采用关联节点结果,同时支持通过调整置信度阈值动态干预决策。


▶︎ 图谱检索排序

为了优化检索结果的相关性和准确性,ADB PG GraphRAG服务实现了重排序(Reranking)机制,优化结果优先级,确保返回最契合用户需求的信息序列。

04、场景实践:模糊查询的精准决策突破

在对问题进行分析处理时,行业专家通常会构建一个或多个知识图谱。这些知识图谱基于具体的应用场景设计,通过与用户进行追问式对话,能够将广泛的问题逐步细化,并最终定位到具体的状况上。通过这种层次化的分析方法,可以有效地从宏观层面的问题过渡到微观层面的特定情境,从而为用户提供精准且针对性强的解决方案。

场景一:家电故障诊断-从模糊描述到根因定位

在以家电为代表的智能电子行业中,咨询类客服系统的需求日益凸显,但是用户咨询的问题往往过于模糊,不能直接通过AI Agent定位到客户的问题并给出解决方案。所以,这类系统旨在通过多轮提问,获取更多有价值的信息,精准地识别用户在产品使用过程中遇到的具体问题,并据此提供切实可行的解决方案。它不仅能够有效提升用户体验,还能进一步优化售后服务流程。此类智能化客服平台,凭借其卓越的问题诊断能力和高效的服务响应机制,在当今竞争激烈的市场环境中显得尤为重要。


下面是一个空调售后机器人的故障问答场景:


--Agent:你好,我是空调售后助手,请问有什么可以帮你?

--User:我的空调制冷效果不理想,能帮忙看一下么?

--Agent:是你的空调吹风风量小还是制冷效果差?

--User:制冷效果不好。

--Agent:请看一下空调的运行模式,是不是在制冷模式?

--User:制冷模式。

--Agent:空调滤网是否长时间没有清理?

--User:是的。

--Agent:请清理滤网后再观察一下空调制冷情况。

image.png


在空调售后案例中,用户提出“制冷效果不理想”的模糊问题。售后Agent通过多轮追问引导用户补充信息:首轮区分“风量小”或“制冷效果差”,第二轮确认空调运行模式,第三轮核查滤网状态,最终给出“需要清理滤网后观察”的解决方案。整个过程依托知识图谱的实体关联路径(运行模式→滤网状态),实现从泛化问题到具体根因的精准定位,有效提升了售后服务效率。

场景二:医疗问诊

在现代医疗问诊场景中,提供24小时在线智能预问诊服务以减轻医生负担显得尤为重要,但是AI Agent通常无法通过传统的“望闻问切”方法逐步从患者那里获取更多有助于判断疾病的信息。因此需要一个为患者和医生提供决策参考的辅助系统,通过患者提供的症状信息,判断潜在病症,为患者提供快速简便的建议,并协助医生作出合理决策。


--Agent:你好,有什么问题可以帮你?

--User:最近一直肚子疼,不知道什么原因。

--Agent:请问是上腹疼痛么?

--User:是的,感觉是胃这边比较疼。

--Agent:是否有恶心或者消化不良、嗳气、黑便等其他症状?

--User:吃完饭会有点反酸。

--Agent:您可能有胃部相关的疾病,建议继续做胃镜或者x线钡剂检查以确认具体的病因。

image.png


医疗问诊辅助系统能够基于医疗专用的知识图谱,创建症状 -> 诊断 -> 检查 -> 疾病之间的知识关系图谱,并通过持续整合病历案例不断优化诊疗路径,提升诊疗效率。在Agent使用过程中,系统会根据患者的主诉症状进行图谱初筛,生成附带置信度的初步诊断;当置信度不足时启动多轮对话补充关键症状,如发热时长、疼痛部位等,逐步收敛疾病范围直至达到置信阈值。最终依据医疗规范输出检查建议或明确疾病结论,直接衔接给药、住院等后续流程。在临床实践中,该系统不仅能引导患者精准匹配科室分诊,更能降低资源匮乏地区医生因经验不足导致的误诊风险。


了解更多

阿里云瑶池数据库助您实现高效安全的 GraphRAG 业务应用解决方案。数据不出域,安全有保障,服务更稳定!👍

💡点击链接了解关于 GraphRAG 服务的更多详情

💬如果您有相关部署需求,欢迎钉钉搜索群号:11700737 or 扫码入群交流。

image.png

相关实践学习
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
2天前
|
人工智能 安全 网络安全
|
2天前
|
人工智能 机器人 Serverless
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
当云计算遇见具身智能,AI咖啡开启零售新体验。用户通过手机生成个性化图像,云端AI快速渲染,机器人精准复刻于咖啡奶泡之上,90秒内完成一杯可饮用的艺术品。该方案融合阿里云FunctionAI生图能力与安诺机器人高精度执行系统,实现AIGC创意到实体呈现的闭环,为线下零售提供低成本、高互动、易部署的智能化升级路径,已在商场、机场、展馆等场景落地应用。
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
|
8天前
|
人工智能 关系型数据库 OLAP
一键搞定本土认证难题,AnalyticDB版Supabase助力AI应用实现支付宝&微信登录
阿里云AnalyticDB PostgreSQL版推出全新第三方身份认证能力,原生支持微信、支付宝、GitHub、Google、Apple等主流平台登录,助力开发者快速构建本土化用户系统。相比传统开发方式,无需从零开发认证模块,5分钟即可完成集成,大幅降低开发成本。适用于AI应用、创业项目及企业级智能应用,提升用户增长效率,实现安全、便捷的身份管理。
|
8天前
|
人工智能 机器人 新能源
深化新工科建设 共探智能新未来 | 阿里云支持南京大学苏州校区“AI DAY”盛大启幕丨云工开物
9月12日,南京大学苏州校区举办“AI新视界:深化新工科建设进行式”活动,采用教师与学生双专场模式,通过主题分享、实践演练、产业课题发布等形式,搭建产教融合AI交流平台,助力未来产业科技人才培养。
|
8天前
|
存储 人工智能 关系型数据库
阿里云AnalyticDB for PostgreSQL 入选VLDB 2025:统一架构破局HTAP,Beam+Laser引擎赋能Data+AI融合新范式
在数据驱动与人工智能深度融合的时代,企业对数据仓库的需求早已超越“查得快”这一基础能力。面对传统数仓挑战,阿里云瑶池数据库AnalyticDB for PostgreSQL(简称ADB-PG)创新性地构建了统一架构下的Shared-Nothing与Shared-Storage双模融合体系,并自主研发Beam混合存储引擎与Laser向量化执行引擎,全面解决HTAP场景下性能、弹性、成本与实时性的矛盾。 近日,相关研究成果发表于在英国伦敦召开的数据库领域顶级会议 VLDB 2025,标志着中国自研云数仓技术再次登上国际舞台。
85 0
人工智能 关系型数据库 OLAP
63 0
|
17天前
|
人工智能 API
阿里云百炼API-KEY在哪查询?如何获取阿里云AI百炼大模型的API-KEY?
阿里云百炼是阿里云推出的AI大模型平台,用户可通过其管理控制台获取API-KEY。需先开通百炼平台及大模型服务,即可创建并复制API-KEY。目前平台提供千万tokens免费额度,详细操作流程可参考官方指引。
|
1月前
|
存储 人工智能 分布式计算
数据不用搬,AI直接炼!阿里云AnalyticDB AI数据湖仓一站式融合AI+BI
阿里云瑶池旗下的云原生数据仓库AnalyticDB MySQL版(以下简称ADB)诞生于高性能实时数仓时代,实现了PB级结构化数据的高效处理和分析。在前几年,为拥抱大数据的浪潮,ADB从传统数仓拓展到数据湖仓,支持Paimon/Iceberg/Delta Lake/Hudi湖格式,为开放的数据湖提供数据库级别的性能、可靠性和管理能力,从而更好地服务以SQL为核心的大规模数据处理和BI分析,奠定了坚实的湖仓一体基础。

热门文章

最新文章