阿里云析言XiYan-SQL智能体,登顶BIRD-CRITIC全球榜单!

简介: 阿里云飞天实验室自研数据分析智能体“析言 XiYan-SQL”在全球权威SQL诊断基准BIRD-CRITIC(SWE-SQL)多项榜单中排名第一,超越国内外顶尖团队。该模型在真实数据库问题诊断、跨方言鲁棒性、复杂SQL处理及分布外泛化等方面表现卓越,支持MySQL、PostgreSQL等主流数据库。技术上创新采用模式筛选、多生成器集成与候选重组策略,提升SQL生成质量与系统适应性。核心模型已开源至GitHub、ModelScope和Hugging Face,欢迎开发者体验贡献。

📖近日,阿里云飞天实验室自研数据分析智能体 “析言 XiYan-SQL” 在全球权威SQL诊断评测基准 BIRD-CRITIC(又名 SWE-SQL) 的所有开放榜单中位居第一,超越多家国内外顶尖团队,再次刷新SQL诊断与修复能力的行业纪录。

❓ BIRD-CRITIC基准 (亦称SWE-SQL),由学界与Google Cloud合作推出,为了回答一个核心问题:“大语言模型能否解决真实数据库应用中的用户问题?”。它把企业里常见的数据库报错、性能问题、查询需求整理成题目,覆盖 MySQL、PostgreSQL、SQL Server、Oracle 等主流数据库系统,既有简单查询,也有插入、更新、删除等复杂操作,还包含大量模型从未见过的新场景,整体难度远高于传统的 “自然语言生成 SQL” 测试。

✍️在这套“真实难题”上,析言XiYan-SQL在 BIRD-CRITIC-1.0-Open、BIRD-CRITIC-PG、BIRD-CRITIC-Flash  三个重要榜单上全部斩获第一,在跨方言鲁棒性、复杂 SQL 处理能力、真实问题修复率和分布外泛化等维度获得权威验证。

技术上,析言 XiYan-SQL 通过 相关模式筛选(Schema Filter)、多生成器集成(Multi-Generator Ensemble)、候选重组与最优选择(Selection with Candidate Reorganization) 等创新,使模型既能生成高质量 SQL,又兼顾可执行性与可维护性,能够在存在脏数据、异构模式和跨方言差异的真实系统中,给出高可用的诊断与修复方案。

👏目前,XiYan-SQL相关模型与核心组件已于 GitHub、ModelScope和Hugging Face 社区开源,欢迎开发者前往体验与贡献。


7B9D84EB-48A3-4c99-B62B-D72C46270453.png 1FAF527F-235C-4bfe-9F6D-C413D777F66E.png A12C57C4-4B19-4d39-9C3A-44573C2B49DD.png

CF5E4AC5-39C3-436c-A061-E71D83CCC7A6.png 66640998-598B-4aa0-8CF6-F6F16B62C566.png

相关文章
|
1月前
|
人工智能
【AI实训营12月重磅焕新】RAG专题课+创客挑战赛双线开启!手把手教你打造“专属阅读搭子”,赢限量行李箱+双重好礼🎁
告别PDF阅读烦恼!首期「企业级文本知识库构建」RAG实战课上线,知名科技博主【AI进化论花生】亲授,手把手教你用阿里云百炼平台打造专属“智能阅读助手”。学课程、补通识、冲榜单,参与即有机会赢神秘礼品及限量高颜值行李箱!立即加入,智胜未来!
151 11
|
1月前
|
SQL 人工智能 缓存
阿里云百炼产品月刊【2025年11月】
通义千问本月重磅升级:上线10款多模态与语音模型,涵盖ASR、TTS、视觉语言及翻译;MCP市场新增3个云服务,上架24个电商应用模板;推出实训Agent创客活动,助力高效生成电商视觉内容。
713 10
|
24天前
|
人工智能 Java Serverless
AgentScope Java 答疑时间:开发者近期最关心的12个问题
近日,AgentScope Java V1.0 版本正式发布,全面对齐 Python 版核心能力,为 Java 开发者带来了构建企业级 Agentic 应用强大的开源方案。在最近与 DataWhale 合作的 AgentScope Java 解读线上直播间中,我们收到了大家的热情提问。为了方便大家集中查阅,我们整理了其中最高频的 Q&A,由 AgentScope Java 的核心开发者为大家一次性说清讲透!
387 14
|
1月前
|
人工智能 自然语言处理 文字识别
Qwen3-Omni新升级:声形意合,令出智随!
Qwen3-Omni-Flash-2025-12-01是全新升级的全模态大模型,支持文本、图像、音频、视频输入,实现自然语音与文本同步输出。全面优化音视频理解与生成,支持多轮流畅对话、自定义人设与系统指令,提升多语言及跨模态交互准确性,语音更拟人,图像视频理解更深入,打造“声形意合”的智能交互体验。(239字)
394 0
|
人工智能 自然语言处理 大数据
阿里云百炼,带你搭建外贸图片翻译助手智能体 从阿里云OpenAPI导入机器翻译API,实现OpenAPI自定义MCP
阿里云提供一站式内容本地化解决方案,涵盖图文视频多模态翻译。通过机器翻译、图片诊断、标题优化等API,助力跨境电商高效实现商品信息多语言智能转换与优化,降低人工成本,提升出海效率。
428 0
|
2月前
|
人工智能 移动开发 数据可视化
阿里云百炼 UI 设计器:让 AI 对话秒变可交互界面
阿里云百炼 UI 设计器的使命,是以低门槛、高效率的方式,让开发者与非技术人员也能在极短时间内,完成专业级 AI 应用的构建、发布与运行,从而加速 AI 技术的业务落地与价值兑现。未来,UI 设计器将持续围绕能搭、搭好、好搭三大方向打磨能力。
728 0