从登顶BIRD-CRITIC榜单到亮相国际顶会,瑶池Data Agent 的性能与体验双突破

简介: Data Agent是阿里云瑶池推出的智能数据分析体,基于Multi-Agent协同架构,融合NL2SQL、RAG与自我校验技术,支持自然语言交互、复杂根因分析与可视化报告生成。全球权威BIRD-CRITIC榜单第一,通过CCF A类会议与DIA大奖认证,实现“人人可用、可信可控”的企业级AI分析。

在很多企业里,数据并不稀缺,真正稀缺的是——能被快速理解、被信任、并真正参与决策的数据洞察。

我们一直在思考:如果获取数据价值不再需要复杂的工具切换、专业门槛和漫长等待,会是什么样?

这正是我们打造 Data Agent 的起点。


性能验证:Bird-Critic 榜单第一

在全球权威的 SQL 评测基准 BIRD-CRITIC中,阿里云瑶池 Data Agent 凭借卓越的表现荣登榜首。BIRD-CRITIC 榜单旨在验证“大模型能否解决现实应用场景中的数据库难题”,该基准 整体难度远高于传统的NL2SQL测试瑶池 Data Agent 的登顶,标志其在复杂场景下的泛化实力已达世界领先水平!

为什么选择 BIRD-CRITIC?

BIRD-CRITIC 是目前全球 SQL 诊断领域最具挑战性的基准测试之一。它打破了传统 NL2SQL 仅聚焦“语句生成”的局限,深度下探至查询修复、DDL 变更安全及性能优化等真实运维核心场景。该基准不仅横跨 MySQL、Oracle 等四大主流方言,更在评估中推行近乎苛刻的列级匹配标准。这种高难度的设定,真实映射了 Data Agent 必须直面的业务挑战——在复杂的场景中,坚守严谨的执行逻辑。

核心引擎:DMS 的技术沉淀

Data Agent 能够取得优异的成绩,离不开阿里云 DMS 在数据库领域的技术积累。我们将 DMS 在多方言语法规则、性能优化模式及数据治理方面的实践经验,通过工程化手段转化为 Agent 可利用的知识库。这使得 Agent 在处理 Oracle 的特殊分页或 MySQL 的隐式转换等细节问题时,能够更加准确和规范。

真实架构:多 Agent 协同

在架构设计上,我们沿用了 Data Agent 生产环境中的 Multi-Agent 协同机制

  • 意图规划 Agent (Coordinator): 主要负责解析模糊需求,利用元数据能力探测数据分布,协助消解业务歧义。
  • 执行校验 Agent (Critic): 基于规划生成 SQL,并进行确定性验证(Determinism Check)和安全性评估,保障执行过程的可靠性。

这种“规划-执行-校验”的闭环流程,不仅在测试中验证了有效性,也是我们处理复杂数据任务的基础范式。

这对用户来说,这背后的意义只有一个:它不是 Demo,而是可以放心交给真实业务的数据智能体!

它能同时覆盖传统BI分析(描述性、诊断性)和高级分析(预测性、规范性),既可以作为自然语言到SQL查询的转换工具(NL2SQL),也可以生成预定义报表的聊天式BI(包括ChatBI),是一个具备理解分析意图、规划分析路径、执行复杂任务、并生成深度洞察的自主智能系统,能稳定完成复杂、多步骤的数据分析任务。

体验认证:斩获国家级创新奖项,并入选 CCF A 类国际会议

在性能之外,Data Agent 的产品体验也获得了行业权威认可。

Data Agent 荣获 中国设计智造大奖(DIA)。DIA是国内最具影响力的国际创新设计奖项之一,评审严格、覆盖多维度价值,被视为衡量产品创新实力与国际竞争力的重要标志。

同时,围绕 Data Agent 在分析过程透明度与人机协同体验上的实践成果,还成功入选 CCF A 类国际会议 CSCW 2025,进一步证明了 Data Agent 在复杂交互与体验可信性方面的工程深度和行业关注度。

https://dl.acm.org/doi/10.1145/3715070.3749256

这些权威背书验证了一点:

当 AI 承担更复杂的数据分析任务时,体验本身已经成为产品竞争力的重要组成。


数据安全 :“三位一体”全链路保障

DMS Data Agent 构建了“身份-环境-管控”三位一体的安全体系:

  1. 访问控制:通过“安全托管”实现账号密码不落地;支持细粒度权限、自动脱敏与全程审计。
  2. 环境隔离:采用内核级沙箱与VPC闭环隔离,确保数据交互在闭环内完成,阻断外网威胁。
  3. 管控安全:租户级会话隔离,任务结束即销毁环境并清除数据,杜绝数据残留。

该方案实现了“账号不落地、环境全隔离、操作可审计、数据无残留”的全链路安全保障。


Data-for-All:人人可用的数据分析,从任务开始

我们始终坚持一个判断:不是所有分析任务,都需要同样的过程呈现方式。

因此,Data Agent 采用任务驱动的透明度策略,根据任务复杂度,自动选择最合适的体验方式。

简单任务:低透明度,效率优先

在日常问数、快速判断场景中,Data Agent 直接给出结果,并生成可交互的图表。

用户无需被执行过程打断,用最短路径,得到可用答案。

复杂任务:高透明度,助推认知

在业务复盘、策略分析等复杂场景中,Data Agent 会先生成分析计划,再分步骤执行分析,最终产出结构化的网页洞察报告。

用户不仅能看到结论,也能理解“这个结论是如何得出的”,整个分析过程清晰可见、可控且可信,关键步骤可回溯,确保结果既可靠又透明。


Human in the loop:人智协同,分析准确

在 AI 代理式分析过程中,用户始终处在决策链路中。

分析过程清晰可追溯;涉及关键或高风险操作时,系统会主动确认;用户可随时调整、补充分析方向。

AI 不替代判断,而是成为一个可协作、可校正的分析伙伴


结语

我们坚信,真正深耕业务的数据智能,绝非单纯的“智力堆砌”,而是平时的极致高效与关键环节的透明可信。从问鼎 BIRD-CRITIC 榜单,到收获 DIA 与 CCF A 类顶会的双重认可,Data Agent 实现了在性能与体验上的双突破,也是我们迈向“人人可用的数据分析”的重要一步。

  1. 了解更多产品详情:https://help.aliyun.com/zh/dms/data-agent-for-analytics
  2. 报名参加Data Agent训练营,带你7天获得“职场外挂”:https://edu.aliyun.com/trainingcamp/3524000
  3. 欢迎钉钉搜索群号“105130018526” 或扫码加入钉群

目录
相关文章
|
9天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
6天前
|
人工智能 机器人 Linux
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI智能体,支持飞书等多平台对接。本教程手把手教你Linux下部署,实现数据私有、系统控制、网页浏览与代码编写,全程保姆级操作,240字内搞定专属AI助手搭建!
4253 13
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
|
5天前
|
人工智能 安全 机器人
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI助手,支持钉钉、飞书等多平台接入。本教程手把手指导Linux下部署与钉钉机器人对接,涵盖环境配置、模型选择(如Qwen)、权限设置及调试,助你快速打造私有、安全、高权限的专属AI助理。(239字)
3408 9
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
|
8天前
|
人工智能 JavaScript 应用服务中间件
零门槛部署本地AI助手:Windows系统Moltbot(Clawdbot)保姆级教程
Moltbot(原Clawdbot)是一款功能全面的智能体AI助手,不仅能通过聊天互动响应需求,还具备“动手”和“跑腿”能力——“手”可读写本地文件、执行代码、操控命令行,“脚”能联网搜索、访问网页并分析内容,“大脑”则可接入Qwen、OpenAI等云端API,或利用本地GPU运行模型。本教程专为Windows系统用户打造,从环境搭建到问题排查,详细拆解全流程,即使无技术基础也能顺利部署本地AI助理。
6915 15
|
6天前
|
存储 人工智能 机器人
OpenClaw是什么?阿里云OpenClaw(原Clawdbot/Moltbot)一键部署官方教程参考
OpenClaw是什么?OpenClaw(原Clawdbot/Moltbot)是一款实用的个人AI助理,能够24小时响应指令并执行任务,如处理文件、查询信息、自动化协同等。阿里云推出的OpenClaw一键部署方案,简化了复杂配置流程,用户无需专业技术储备,即可快速在轻量应用服务器上启用该服务,打造专属AI助理。本文将详细拆解部署全流程、进阶功能配置及常见问题解决方案,确保不改变原意且无营销表述。
4484 4
|
3天前
|
人工智能 机器人 Linux
OpenClaw(Clawdbot、Moltbot)汉化版部署教程指南(零门槛)
OpenClaw作为2026年GitHub上增长最快的开源项目之一,一周内Stars从7800飙升至12万+,其核心优势在于打破传统聊天机器人的局限,能真正执行读写文件、运行脚本、浏览器自动化等实操任务。但原版全英文界面对中文用户存在上手门槛,汉化版通过覆盖命令行(CLI)与网页控制台(Dashboard)核心模块,解决了语言障碍,同时保持与官方版本的实时同步,确保新功能最快1小时内可用。本文将详细拆解汉化版OpenClaw的搭建流程,涵盖本地安装、Docker部署、服务器远程访问等场景,同时提供环境适配、问题排查与国内应用集成方案,助力中文用户高效搭建专属AI助手。
2304 5
|
8天前
|
人工智能 JavaScript API
零门槛部署本地 AI 助手:Clawdbot/Meltbot 部署深度保姆级教程
Clawdbot(Moltbot)是一款智能体AI助手,具备“手”(读写文件、执行代码)、“脚”(联网搜索、分析网页)和“脑”(接入Qwen/OpenAI等API或本地GPU模型)。本指南详解Windows下从Node.js环境搭建、一键安装到Token配置的全流程,助你快速部署本地AI助理。(239字)
4551 23
|
14天前
|
人工智能 API 开发者
Claude Code 国内保姆级使用指南:实测 GLM-4.7 与 Claude Opus 4.5 全方案解
Claude Code是Anthropic推出的编程AI代理工具。2026年国内开发者可通过配置`ANTHROPIC_BASE_URL`实现本地化接入:①极速平替——用Qwen Code v0.5.0或GLM-4.7,毫秒响应,适合日常编码;②满血原版——经灵芽API中转调用Claude Opus 4.5,胜任复杂架构与深度推理。
8351 12

热门文章

最新文章