在很多企业里,数据并不稀缺,真正稀缺的是——能被快速理解、被信任、并真正参与决策的数据洞察。
我们一直在思考:如果获取数据价值不再需要复杂的工具切换、专业门槛和漫长等待,会是什么样?
这正是我们打造 Data Agent 的起点。
性能验证:Bird-Critic 榜单第一
在全球权威的 SQL 评测基准 BIRD-CRITIC中,阿里云瑶池 Data Agent 凭借卓越的表现荣登榜首。BIRD-CRITIC 榜单旨在验证“大模型能否解决现实应用场景中的数据库难题”,该基准 整体难度远高于传统的NL2SQL测试。瑶池 Data Agent 的登顶,标志其在复杂场景下的泛化实力已达世界领先水平!
为什么选择 BIRD-CRITIC?
BIRD-CRITIC 是目前全球 SQL 诊断领域最具挑战性的基准测试之一。它打破了传统 NL2SQL 仅聚焦“语句生成”的局限,深度下探至查询修复、DDL 变更安全及性能优化等真实运维核心场景。该基准不仅横跨 MySQL、Oracle 等四大主流方言,更在评估中推行近乎苛刻的列级匹配标准。这种高难度的设定,真实映射了 Data Agent 必须直面的业务挑战——在复杂的场景中,坚守严谨的执行逻辑。
核心引擎:DMS 的技术沉淀
Data Agent 能够取得优异的成绩,离不开阿里云 DMS 在数据库领域的技术积累。我们将 DMS 在多方言语法规则、性能优化模式及数据治理方面的实践经验,通过工程化手段转化为 Agent 可利用的知识库。这使得 Agent 在处理 Oracle 的特殊分页或 MySQL 的隐式转换等细节问题时,能够更加准确和规范。
真实架构:多 Agent 协同
在架构设计上,我们沿用了 Data Agent 生产环境中的 Multi-Agent 协同机制:
- 意图规划 Agent (Coordinator): 主要负责解析模糊需求,利用元数据能力探测数据分布,协助消解业务歧义。
- 执行校验 Agent (Critic): 基于规划生成 SQL,并进行确定性验证(Determinism Check)和安全性评估,保障执行过程的可靠性。
这种“规划-执行-校验”的闭环流程,不仅在测试中验证了有效性,也是我们处理复杂数据任务的基础范式。
这对用户来说,这背后的意义只有一个:它不是 Demo,而是可以放心交给真实业务的数据智能体!
它能同时覆盖传统BI分析(描述性、诊断性)和高级分析(预测性、规范性),既可以作为自然语言到SQL查询的转换工具(NL2SQL),也可以生成预定义报表的聊天式BI(包括ChatBI),是一个具备理解分析意图、规划分析路径、执行复杂任务、并生成深度洞察的自主智能系统,能稳定完成复杂、多步骤的数据分析任务。
体验认证:斩获国家级创新奖项,并入选 CCF A 类国际会议
在性能之外,Data Agent 的产品体验也获得了行业权威认可。
Data Agent 荣获 中国设计智造大奖(DIA)。DIA是国内最具影响力的国际创新设计奖项之一,评审严格、覆盖多维度价值,被视为衡量产品创新实力与国际竞争力的重要标志。
同时,围绕 Data Agent 在分析过程透明度与人机协同体验上的实践成果,还成功入选 CCF A 类国际会议 CSCW 2025,进一步证明了 Data Agent 在复杂交互与体验可信性方面的工程深度和行业关注度。
https://dl.acm.org/doi/10.1145/3715070.3749256
这些权威背书验证了一点:
当 AI 承担更复杂的数据分析任务时,体验本身已经成为产品竞争力的重要组成。
数据安全 :“三位一体”全链路保障
DMS Data Agent 构建了“身份-环境-管控”三位一体的安全体系:
- 访问控制:通过“安全托管”实现账号密码不落地;支持细粒度权限、自动脱敏与全程审计。
- 环境隔离:采用内核级沙箱与VPC闭环隔离,确保数据交互在闭环内完成,阻断外网威胁。
- 管控安全:租户级会话隔离,任务结束即销毁环境并清除数据,杜绝数据残留。
该方案实现了“账号不落地、环境全隔离、操作可审计、数据无残留”的全链路安全保障。
Data-for-All:人人可用的数据分析,从任务开始
我们始终坚持一个判断:不是所有分析任务,都需要同样的过程呈现方式。
因此,Data Agent 采用任务驱动的透明度策略,根据任务复杂度,自动选择最合适的体验方式。
简单任务:低透明度,效率优先
在日常问数、快速判断场景中,Data Agent 直接给出结果,并生成可交互的图表。
用户无需被执行过程打断,用最短路径,得到可用答案。
复杂任务:高透明度,助推认知
在业务复盘、策略分析等复杂场景中,Data Agent 会先生成分析计划,再分步骤执行分析,最终产出结构化的网页洞察报告。
用户不仅能看到结论,也能理解“这个结论是如何得出的”,整个分析过程清晰可见、可控且可信,关键步骤可回溯,确保结果既可靠又透明。
Human in the loop:人智协同,分析准确
在 AI 代理式分析过程中,用户始终处在决策链路中。
分析过程清晰可追溯;涉及关键或高风险操作时,系统会主动确认;用户可随时调整、补充分析方向。
AI 不替代判断,而是成为一个可协作、可校正的分析伙伴。
结语
我们坚信,真正深耕业务的数据智能,绝非单纯的“智力堆砌”,而是平时的极致高效与关键环节的透明可信。从问鼎 BIRD-CRITIC 榜单,到收获 DIA 与 CCF A 类顶会的双重认可,Data Agent 实现了在性能与体验上的双突破,也是我们迈向“人人可用的数据分析”的重要一步。
- 了解更多产品详情:https://help.aliyun.com/zh/dms/data-agent-for-analytics
- 报名参加Data Agent训练营,带你7天获得“职场外挂”:https://edu.aliyun.com/trainingcamp/3524000
- 欢迎钉钉搜索群号“105130018526” 或扫码加入钉群