阿里云析言XiYan-SQL智能体,登顶BIRD-CRITIC全球榜单!

简介: 阿里云飞天实验室自研数据分析智能体“析言 XiYan-SQL”在全球权威SQL诊断基准BIRD-CRITIC(SWE-SQL)多项榜单中排名第一,超越国内外顶尖团队。该模型在真实数据库问题诊断、跨方言鲁棒性、复杂SQL处理及分布外泛化等方面表现卓越,支持MySQL、PostgreSQL等主流数据库。技术上创新采用模式筛选、多生成器集成与候选重组策略,提升SQL生成质量与系统适应性。核心模型已开源至GitHub、ModelScope和Hugging Face,欢迎开发者体验贡献。

📖近日,阿里云飞天实验室自研数据分析智能体 “析言 XiYan-SQL” 在全球权威SQL诊断评测基准 BIRD-CRITIC(又名 SWE-SQL) 的所有开放榜单中位居第一,超越多家国内外顶尖团队,再次刷新SQL诊断与修复能力的行业纪录。

❓ BIRD-CRITIC基准 (亦称SWE-SQL),由学界与Google Cloud合作推出,为了回答一个核心问题:“大语言模型能否解决真实数据库应用中的用户问题?”。它把企业里常见的数据库报错、性能问题、查询需求整理成题目,覆盖 MySQL、PostgreSQL、SQL Server、Oracle 等主流数据库系统,既有简单查询,也有插入、更新、删除等复杂操作,还包含大量模型从未见过的新场景,整体难度远高于传统的 “自然语言生成 SQL” 测试。

✍️在这套“真实难题”上,析言XiYan-SQL在 BIRD-CRITIC-1.0-Open、BIRD-CRITIC-PG、BIRD-CRITIC-Flash  三个重要榜单上全部斩获第一,在跨方言鲁棒性、复杂 SQL 处理能力、真实问题修复率和分布外泛化等维度获得权威验证。

技术上,析言 XiYan-SQL 通过 相关模式筛选(Schema Filter)、多生成器集成(Multi-Generator Ensemble)、候选重组与最优选择(Selection with Candidate Reorganization) 等创新,使模型既能生成高质量 SQL,又兼顾可执行性与可维护性,能够在存在脏数据、异构模式和跨方言差异的真实系统中,给出高可用的诊断与修复方案。

👏目前,XiYan-SQL相关模型与核心组件已于 GitHub、ModelScope和Hugging Face 社区开源,欢迎开发者前往体验与贡献。


7B9D84EB-48A3-4c99-B62B-D72C46270453.png 1FAF527F-235C-4bfe-9F6D-C413D777F66E.png A12C57C4-4B19-4d39-9C3A-44573C2B49DD.png

CF5E4AC5-39C3-436c-A061-E71D83CCC7A6.png 66640998-598B-4aa0-8CF6-F6F16B62C566.png

相关文章
|
SQL 自然语言处理 数据挖掘
大模型与数据分析:探索Text-to-SQL(上)
大模型与数据分析:探索Text-to-SQL(上)
6597 0
|
2月前
|
人工智能
【AI实训营12月重磅焕新】RAG专题课+创客挑战赛双线开启!手把手教你打造“专属阅读搭子”,赢限量行李箱+双重好礼🎁
告别PDF阅读烦恼!首期「企业级文本知识库构建」RAG实战课上线,知名科技博主【AI进化论花生】亲授,手把手教你用阿里云百炼平台打造专属“智能阅读助手”。学课程、补通识、冲榜单,参与即有机会赢神秘礼品及限量高颜值行李箱!立即加入,智胜未来!
178 11
|
2月前
|
SQL 人工智能 缓存
阿里云百炼产品月刊【2025年11月】
通义千问本月重磅升级:上线10款多模态与语音模型,涵盖ASR、TTS、视觉语言及翻译;MCP市场新增3个云服务,上架24个电商应用模板;推出实训Agent创客活动,助力高效生成电商视觉内容。
833 10
|
2月前
|
人工智能 自然语言处理 文字识别
Qwen3-Omni新升级:声形意合,令出智随!
Qwen3-Omni-Flash-2025-12-01是全新升级的全模态大模型,支持文本、图像、音频、视频输入,实现自然语音与文本同步输出。全面优化音视频理解与生成,支持多轮流畅对话、自定义人设与系统指令,提升多语言及跨模态交互准确性,语音更拟人,图像视频理解更深入,打造“声形意合”的智能交互体验。(239字)
572 0
|
6月前
|
SQL 机器学习/深度学习 人工智能
从“写SQL”到“聊数据”:NL2SQL如何用自然语言解锁数据库?
本文系统性地阐述了自然语言转SQL(NL2SQL) 技术如何让非技术背景的业务分析师实现数据自助查询,从而提升数据驱动决策的效率与准确性。
从“写SQL”到“聊数据”:NL2SQL如何用自然语言解锁数据库?
|
3月前
|
人工智能 自然语言处理 安全
妙妙妙妙!公文、合同、标书…全妙闭环了
阿里云百炼|全妙,是面向政企、媒体等专业领域的智能创作平台,集“妙策、妙搜、妙笔、妙读”于一体,覆盖公文撰写、合同审查、标书生成、内容采编等高合规场景,助力用户降本增效,释放创造力。
376 25
|
机器学习/深度学习 人工智能 自然语言处理
如何构建企业级数据智能体:Data Agent 开发实践
本篇将介绍DMS的一款数据分析智能体(Data Agent for Analytics )产品的技术思考和实践。Data Agent for Analytics 定位为一款企业级数据分析智能体, 基于Agentic AI 技术,帮助用户查数据、做分析、生成报告、深入洞察。