阿里云析言XiYan-SQL智能体,登顶BIRD-CRITIC全球榜单!

简介: 阿里云飞天实验室自研数据分析智能体“析言 XiYan-SQL”在全球权威SQL诊断基准BIRD-CRITIC(SWE-SQL)多项榜单中排名第一,超越国内外顶尖团队。该模型在真实数据库问题诊断、跨方言鲁棒性、复杂SQL处理及分布外泛化等方面表现卓越,支持MySQL、PostgreSQL等主流数据库。技术上创新采用模式筛选、多生成器集成与候选重组策略,提升SQL生成质量与系统适应性。核心模型已开源至GitHub、ModelScope和Hugging Face,欢迎开发者体验贡献。

📖近日,阿里云飞天实验室自研数据分析智能体 “析言 XiYan-SQL” 在全球权威SQL诊断评测基准 BIRD-CRITIC(又名 SWE-SQL) 的所有开放榜单中位居第一,超越多家国内外顶尖团队,再次刷新SQL诊断与修复能力的行业纪录。

❓ BIRD-CRITIC基准 (亦称SWE-SQL),由学界与Google Cloud合作推出,为了回答一个核心问题:“大语言模型能否解决真实数据库应用中的用户问题?”。它把企业里常见的数据库报错、性能问题、查询需求整理成题目,覆盖 MySQL、PostgreSQL、SQL Server、Oracle 等主流数据库系统,既有简单查询,也有插入、更新、删除等复杂操作,还包含大量模型从未见过的新场景,整体难度远高于传统的 “自然语言生成 SQL” 测试。

✍️在这套“真实难题”上,析言XiYan-SQL在 BIRD-CRITIC-1.0-Open、BIRD-CRITIC-PG、BIRD-CRITIC-Flash  三个重要榜单上全部斩获第一,在跨方言鲁棒性、复杂 SQL 处理能力、真实问题修复率和分布外泛化等维度获得权威验证。

技术上,析言 XiYan-SQL 通过 相关模式筛选(Schema Filter)、多生成器集成(Multi-Generator Ensemble)、候选重组与最优选择(Selection with Candidate Reorganization) 等创新,使模型既能生成高质量 SQL,又兼顾可执行性与可维护性,能够在存在脏数据、异构模式和跨方言差异的真实系统中,给出高可用的诊断与修复方案。

👏目前,XiYan-SQL相关模型与核心组件已于 GitHub、ModelScope和Hugging Face 社区开源,欢迎开发者前往体验与贡献。


7B9D84EB-48A3-4c99-B62B-D72C46270453.png 1FAF527F-235C-4bfe-9F6D-C413D777F66E.png A12C57C4-4B19-4d39-9C3A-44573C2B49DD.png

CF5E4AC5-39C3-436c-A061-E71D83CCC7A6.png 66640998-598B-4aa0-8CF6-F6F16B62C566.png

相关文章
|
SQL 自然语言处理 数据挖掘
大模型与数据分析:探索Text-to-SQL(上)
大模型与数据分析:探索Text-to-SQL(上)
6838 0
|
4月前
|
人工智能 Java Serverless
AgentScope Java 答疑时间:开发者近期最关心的12个问题
近日,AgentScope Java V1.0 版本正式发布,全面对齐 Python 版核心能力,为 Java 开发者带来了构建企业级 Agentic 应用强大的开源方案。在最近与 DataWhale 合作的 AgentScope Java 解读线上直播间中,我们收到了大家的热情提问。为了方便大家集中查阅,我们整理了其中最高频的 Q&A,由 AgentScope Java 的核心开发者为大家一次性说清讲透!
1147 47
|
4月前
|
人工智能
【AI实训营12月重磅焕新】RAG专题课+创客挑战赛双线开启!手把手教你打造“专属阅读搭子”,赢限量行李箱+双重好礼🎁
告别PDF阅读烦恼!首期「企业级文本知识库构建」RAG实战课上线,知名科技博主【AI进化论花生】亲授,手把手教你用阿里云百炼平台打造专属“智能阅读助手”。学课程、补通识、冲榜单,参与即有机会赢神秘礼品及限量高颜值行李箱!立即加入,智胜未来!
216 11
|
4月前
|
SQL 人工智能 缓存
阿里云百炼产品月刊【2025年11月】
通义千问本月重磅升级:上线10款多模态与语音模型,涵盖ASR、TTS、视觉语言及翻译;MCP市场新增3个云服务,上架24个电商应用模板;推出实训Agent创客活动,助力高效生成电商视觉内容。
1007 10
|
1月前
|
SQL 人工智能 Java
告别传统 Text-to-SQL:基于 Spring AI Alibaba 的数据分析智能体 DataAgent 深度解析
超越 NL2SQL,DataAgent 具备自主规划与深度分析能力,赋能企业统计分析、根因定位等复杂场景挑战。
1033 34
|
3月前
|
SQL 人工智能 Java
告别传统 Text-to-SQL:基于 Spring AI Alibaba 的数据分析智能体 DataAgent 深度解析
DataAgent是基于Spring AI Alibaba生态构建的企业级AI数据分析师,融合NL2SQL、多智能体协作与RAG技术,支持多数据源分析、自动纠错与可视化报告生成,让业务人员零代码获取深度数据洞察。
2430 42
告别传统 Text-to-SQL:基于 Spring AI Alibaba 的数据分析智能体 DataAgent 深度解析
|
8月前
|
SQL 机器学习/深度学习 人工智能
从“写SQL”到“聊数据”:NL2SQL如何用自然语言解锁数据库?
本文系统性地阐述了自然语言转SQL(NL2SQL) 技术如何让非技术背景的业务分析师实现数据自助查询,从而提升数据驱动决策的效率与准确性。
从“写SQL”到“聊数据”:NL2SQL如何用自然语言解锁数据库?

热门文章

最新文章

下一篇
开通oss服务