阿里云百炼/析言开源面向 Java 开发者的 NL2SQL 智能体框架

简介: 随着大模型技术发展,NL2SQL在数据分析领域应用广泛,但仍存在Schema理解偏差、复杂查询效率低等问题。阿里云百炼/析言GBI将其中的“Schema召回+SQL生成+执行”核心链路模块化并开源,推出Spring-ai-alibaba-nl2sql项目。该项目基于Spring AI Alibaba框架,提供轻量、高效、可扩展的NL2SQL解决方案,支持Schema智能召回、SQL生成与优化及自动执行等功能,适配多种数据库。其开源地址为:https://github.com/alibaba/spring-ai-alibaba。

随着大模型技术的快速发展,自然语言到 SQL(NL2SQL)能力在数据分析领域的落地日益广泛。然而,传统 NL2SQL 方案存在 Schema 理解偏差、复杂查询生成效率低、执行结果不可控等问题,导致业务场景中频繁出现“答非所问”或“生成失败”的窘境。为了让更多开发者能够便捷地使用这一能力,我们决定将阿里云析言 GBI 中“Schema 召回 + SQL 生成 + SQL 执行”的核心链路模块化、组件化,并以开源的形式回馈社区。


💢项目开源地址:https://github.com/alibaba/spring-ai-alibaba


析言云服务

作为阿里云百炼官方推出的智能数据分析产品,析言 GBI 基于大模型的 ChatBI 技术,帮助用户轻松实现自然语言交互的数据分析。通过 NL2SQL 和数据问答功能,析言 GBI 支持企业快速构建 AI 原生的数据分析解决方案。同时,析言 GBI 提供了丰富的云端服务支持,助力企业实现高效的数据管理与分析。


作为阿里云百炼平台的重要组成部分,析言 GBI 基于通义大模型,针对 NL2SQL 链路进行了深度优化。本次开源聚焦于 Schema 召回、SQL 生成与执行引擎三大核心模块,旨在为开发者提供一个轻量、灵活、可扩展的 NL2SQL 解决方案,让“自然语言对话数据库”真正落地为生产力工具。我们始终秉持“让 SQL 更简单,让数据更自由 ”的初心,希望通过开源与社区共建,推动 NL2SQL 技术在企业级场景中的广泛应用。


Spring AI Alibaba Nl2sql


Spring AI Alibaba 是一款以 Spring AI 为基础,深度集成阿里云百炼平台,支持 ChatBot、工作流、多智能体应用开发模式的 AI 框架。


Spring-ai-alibaba-nl2sql 是基于 Spring AI Alibaba 的一个子项目,致力于打造一套轻量、高效、可扩展的 NL2SQL 框架,让 Java 程序员可以快速构建和集成自然语言查询系统,降低数据问答场景下 AI 能力的接入门槛。


作为阿里云析言 GBI 产品的开源延伸,Spring-ai-alibaba-nl2sql 已经在 GitHub 上发布,并持续更新迭代中。如果你正在寻找一款面向企业级数据场景、支持本地部署与云端调用、兼容多种数据库的 NL2SQL 解决方案,Spring-ai-alibaba-nl2sql 将是一个理想的选择。


核心功能

Schema 智能召回:精准匹配数据库语义

在复杂的数据环境中,用户往往不清楚具体字段名或表结构。Spring-ai-alibaba-nl2sql 提供了强大的语义相似度计算能力和多策略召回机制,能够在海量表结构中精准匹配出最可能涉及的数据库 schema 和字段信息。Schema 召回是 NL2SQL 的第一步,也是决定生成质量的关键环节。析言 GBI 开源模块通过以下创新设计,显著提升 Schema 匹配的准确性:


  • 多模态语义理解 :结合表名、字段名、注释等元数据,构建数据库的“知识图谱”,实现自然语言与 Schema 的双向映射。
  • 动态权重计算 :根据用户问题上下文,动态调整字段相关性权重(如时间维度、业务关键词),避免冗余字段干扰。
  • 集成向量化索引构建。


示例 :
用户提问:“2024 年 A 手机销量对比 B 手机”
Schema 召回结果:

  • 表名:sales_data(相关度 98%)
  • 字段:brand(A 手机、B 手机), sale_date(2024 年), quantity(销量)


SQL 智能生成与优化:从对话到高效查询

基于 Qwen 等主流大语言模型的强大推理能力,析言 Spring-ai-alibaba-nl2sql 实现了从自然语言到结构化 SQL 的一键生成。无论是简单的条件过滤还是复杂的聚合统计、多表关联,都能准确生成对应的 SQL 语句。在复杂 SQL 生成场景中表现卓越:

  • 支持多种数据库方言(MySQL、PostgreSQL)
  • 复杂函数能力 :支持嵌套子查询、多表关联、窗口函数等复杂语法,覆盖 90% 以上业务场景。


生成效果对比 :


输入问提

传统方案生成 SQL

Spring-ai-alibaba-nl2sql

找出销售额最高的前 10 个商品,并展示品类和库存量

SELECT * FROM products ORDER BY sales DESC LIMIT 10(漏掉品类字段)

SELECT product_name, category, stock, sales FROM products ORDER BY sales DESC LIMIT 10


SQL 自动执行与结果反馈:安全、高效、可扩展

生成的 SQL 语句可以直接调度并安全执行,返回结构化结果。同时,系统还提供了丰富的错误处理机制,确保即使在执行失败时也能给出清晰的提示和建议。


  • 数据库连接池管理,提升性能稳定性


Schema 管控模块

同时开源数据库 Schema 管控模块 ,支持对数据库结构的精细管理和向量召回功能。这一模块的引入,使得开发者可以更好地控制和维护数据库结构,提升 Schema 匹配的准确性和效率。


系统特点

轻量模块化设计

Spring-ai-alibaba 采用高度解耦的设计理念,将 Schema 召回、SQL 生成、SQL 执行三个环节进行模块化封装,开发者可以根据自身需求灵活组合,适配不同的业务场景。

基于 Spring Boot 3.x 支持

得益于对 Spring AI Alibaba 的深度集成,析言 GBI-Open 支持 JDK 17+,并提供开箱即用的 Starter 包,开发者只需引入依赖即可快速启动 NL2SQL 服务。

<dependency>
    <groupId>com.alibaba.cloud.ai</groupId>
    <artifactId>spring-ai-alibaba-starter-nl2sql</artifactId>
    <version>${revision}</version>
</dependency>

无缝对接 Qwen 等主流模型服务

支持接入阿里云 DashScope 平台上的 Qwen 系列模型,也预留了其他 LLM 接入接口,方便开发者自由选择适合自己的模型服务。

快速运行

1. 准备环境

访问项目地址下载源码:

git clone https://github.com/springaialibaba/spring-ai-alibaba-examples.git
cd spring-ai-alibaba-nl2sql-example


确保已安装:

  • JDK 17 或更高版本
  • MySQL 8.0(或其他支持 JDBC 的数据库)
  • DashScope API Key(用于大模型服务)

设置 DashScope API Key:


export AI_DASHSCOPE_API_KEY=your_api_key


2. 项目启动

根据 spring-ai-alibaba-nl2sql-example/chat/README.md 相关操作即可一键启动 chat server。

image.png

image.png

开源计划

  • 扩展更多数据库支持 :涵盖主流数据库系统,如 Oracle、SQL Server 等。
  • 提供可视化配置界面 :降低使用门槛,方便非技术人员快速上手。
  • 支持对 SQL 结果进行分析总结 :通过可视化模块展示 SQL 查询结果,帮助用户更直观地理解数据。
  • 深度 BI 分析功能 :集成高级分析能力,满足企业级数据分析需求。

模型开源

析言 GBI 云服务使用的 SQL 生成模型也是开源的,欢迎大家访问以下地址查看和使用:


通过这些模型,开发者可以轻松实现高质量的自然语言到 SQL 的转换。


参考链接


1. Github 项目地址:https://github.com/alibaba/spring-ai-alibaba

2. 官方文档:https://java2ai.com/

总结

Spring-ai-alibaba-nl2sql 是析言 GBI 产品在数据问答领域的一次重要开源尝试,专注于 NL2SQL 场景下的核心能力开放。无论你是想快速搭建一个企业级数据助理原型,还是希望深入研究大模型在数据库交互中的应用,Spring-ai-alibaba-nl2sql 都将是你值得信赖的起点。这不仅是对 NL2SQL 技术的一次革新,更是对“开箱即用、共建共享”开源精神的践行。我们相信,通过社区的共同努力,每一个开发者都能轻松驾驭自然语言与数据库的对话,让数据价值触手可及。

让 SQL 更简单,让未来更自由!


💨如需进一步了解析言 GBI 的完整能力(企业级部署、独立可视化模块),请参考阿里云官方文档:

https://help.aliyun.com/zh/model-studio/user-guide/brief-introduction-of-gbi-products?spm=a2ty_o01.29997173.0.0.35603715qRHRic


👇如果有需要了解析言的,可以点击下面链接进入查看哦~~

阿里云百炼/析言官网网址

阿里云百炼/析言控制台

也可我们的官方支持群:117600000451进行交流反馈!

1739845952459.png



相关文章
|
2月前
|
人工智能 数据挖掘
🔔阿里云百炼智能体和工作流可以发布为组件了,AI应用变成“搭积木”
本文介绍了如何通过智能体组件化设计快速生成PPT。首先,创建一个“PPT大纲生成”智能体并发布为组件,该组件可根据用户输入生成结构清晰的大纲。接着,在新的智能体应用中调用此组件与MCP服务(如ChatPPT),实现从大纲到完整PPT的自动化生成。整个流程模块化、复用性强,显著降低AI开发门槛,提升效率。非技术人员也可轻松上手,满足多样化场景需求。
284 0
🔔阿里云百炼智能体和工作流可以发布为组件了,AI应用变成“搭积木”
|
1月前
|
SQL 人工智能 Java
阿里云百炼开源面向 Java 开发者的 NL2SQL 智能体框架
Spring-ai-alibaba-nl2sql 是析言 GBI 产品在数据问答领域的一次重要开源尝试,专注于 NL2SQL 场景下的核心能力开放。
439 48
|
2天前
|
数据采集 数据可视化 定位技术
阿里云百炼智能体与工作流深度联动,打造更灵活的AI+流程开发体验
阿里云百炼平台推出智能体与工作流相互调用功能,支持四种灵活嵌套模式,提升复杂业务流程的复用与自动化能力。通过组件化封装,用户可在智能体中调用工作流,或在工作流中嵌套智能体,显著提高开发效率与系统灵活性,适用于不同技术水平的开发者。
54 0
阿里云百炼智能体与工作流深度联动,打造更灵活的AI+流程开发体验
|
5月前
|
人工智能 API
【保姆级教程]】5分钟用阿里云百炼满血版DeepSeek, 手把手做一个智能体
阿里云推出手把手学AI直播活动,带你体验DeepSeek玩法。通过阿里云百炼控制台,用户可免费开通满血版R1模型,享受100w token免费额度。活动还包括实验步骤、应用开发教程及作业打卡赢好礼环节,提交优秀作品更有机会获得定制礼品。快来参与吧!
2420 10
|
8天前
|
存储 人工智能 NoSQL
【阿里云百炼全栈焕新】DAY1—智能体配置教程-打造抖音小助手
在短视频盛行的时代,抖音已成为内容创作和营销的重要平台。面对海量视频与复杂运营需求,如何高效管理内容成为挑战。阿里云百炼平台提供了解决方案——通过配置智能体打造专属抖音助手,可获取视频信息、提取文案、润色改写,提升效率。本文详解了从开通服务、创建智能体到功能测试的全过程,助你轻松搭建高效短视频运营工具。
178 2
|
2月前
|
人工智能 自然语言处理 机器人
阿里云百炼xWaytoAGI共学课 DAY4 - 小白也能在阿里云百炼手搓Qwen3,构建Qwen3赋能的英语学习智能体“妮娜”
本次课程通过构建"英语老师妮娜"AI应用,教授Qwen3系列模型特性及阿里云百炼平台的MCP服务、工作流集成技术。重点学习模型选择、智能体开发流程,涵盖单词卡片生成、结构化分析、Notion存档及二维码分享功能,适合开发者、产品经理等人群掌握AI应用落地方法。
749 42
|
7月前
|
API 数据库 决策智能
基于百炼平台qwen-max的api 打造一套 检索增强 图谱增强 智能工具调用决策的智能体
本文介绍了一种基于阿里云百炼平台的`qwen-max` API构建的智能体方案,该方案集成了检索增强、图谱增强及智能工具调用决策三大模块,旨在通过结合外部数据源、知识图谱和自动化决策提高智能回答的准确性和丰富度。通过具体代码示例展示了如何实现这些功能,最终形成一个能灵活应对多种查询需求的智能系统。
533 11
|
7月前
|
自然语言处理 NoSQL API
基于百炼平台qwen-max的api 打造一套 检索增强 图谱增强 基于指令的智能工具调用决策 智能体
基于百炼平台的 `qwen-max` API,设计了一套融合检索增强、图谱增强及指令驱动的智能工具调用决策系统。该系统通过解析用户指令,智能选择调用检索、图谱推理或模型生成等工具,以提高问题回答的准确性和丰富性。系统设计包括指令解析、工具调用决策、检索增强、图谱增强等模块,旨在通过多种技术手段综合提升智能体的能力。
530 5
|
4月前
|
人工智能 JavaScript 前端开发
一个支持阿里云百炼平台DeepSeek R1大模型(智能体)的Wordpress插件,AI Agent or Chatbot.
这是一个将阿里云DeepSeek AI服务集成到WordPress的聊天机器人插件,支持多轮对话、上下文记忆和自定义界面等功能。用户可通过短代码轻松添加到页面,并支持多种配置选项以满足不同需求。项目采用MIT协议授权,代码仓位于GitHub与Gitee。开发者Chi Leung为长期境外工作,代码注释以英文为主。适合需要在WordPress网站中快速部署AI助手的用户使用。
|
3月前
【MCP教程系列】当阿里云百炼智能体携带MCP,超级GitHub运营即刻上岗
阿里云百炼提供了一系列预置的MCP服务,无需自行部署或支付资源费用。通过简单几步,即可在智能体中添加MCP服务,自动实现调用兼容。
535 3

相关产品

  • 大模型服务平台百炼