Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台

简介: Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!

作者:孔可青


01 背景与挑战


1.1 行业背景:AI Agent 迈入规模化落地新阶段

随着生成式 AI 技术逐步成熟,AI Agent 已经越过技术炒作周期的峰值,进入大规模探索与产业落地的关键阶段越来越多的企业开始将 AI Agent 应用于智能客服、自动化运营、辅助决策等核心业务场景,推动智能化升级。


在此背景下,Spring AI Alibaba 作为开源的 AI Agent 开发框架,致力于为 Java 生态开发者提供一套标准化、可扩展、生产就绪的开发体系。框架支持从基础 Agent 构建、工作流编排(Workflow)、检索增强生成(RAG)到多模型适配的全栈能力,帮助开发者快速构建高质量的生成式 AI 应用。


官网https://java2ai.com
GitHubhttps://github.com/alibaba/spring-ai-alibaba


1.2 企业级 AI 应用落地的核心挑战

尽管 Spring AI Alibaba 开发框架显著降低了入门门槛,但在真实的企业研发流程中,从原型验证到生产上线仍面临诸多工程化挑战。这些挑战贯穿 Dev(开发)与 Ops(运维) 两大阶段,直接影响研发效率、系统稳定性与业务价值实现,主要体现在以下三个方面:


1)Prompt 工程缺乏标准化与协作机制

在传统开发模式下,Prompt 多以硬编码形式存在于代码中,导致:

  • 修改 Prompt 需重新编译和重启应用,调试周期长、成本高;
  • 缺乏版本管理能力,无法追溯历史变更或进行 A/B 对比;
  • 不同环境间配置不统一,团队协作效率低,易引发一致性问题。

2)AI 应用质量评估体系不健全

  • 当前多数 AI 应用依赖人工验证或临时脚本进行测试,存在明显短板:
  • 测试过程非系统化,难以覆盖多样化的输入场景;
  • 缺少可量化的评估指标,模型输出的质量难以客观衡量;
  • 评估结果不可复现,无法支撑持续迭代与效果对比。

3)线上运行状态不可观测

AI 应用在生产环境中常表现为“黑盒”运行,带来运维难题:

  • 调用链路不透明,异常请求难以定位具体环节;
  • 缺乏细粒度的执行追踪,性能瓶颈识别困难;
  • 故障排查依赖日志堆叠分析,响应效率低,影响服务稳定性。


1.3 破局之道:构建以数据为中心的 AI 研发治理体系

要真正实现 AI Agent 的高效开发与可靠运行,必须突破“重模型、轻工程”的传统思维,转向以数据驱动、流程闭环、工具赋能为核心的现代化研发范式。解决上面问题,我们需要构建一个简单、易用、专业的开发框架,提升研发效率。构建一个以数据为中心的 Agent 开发平台,通过 调试、观测、评估一体化解决 Dev 阶段调试效率和效果问题。


02 Spring AI AIibaba Admin:以数据为中心的 Agent 开发平台


核心价值

为应对企业级 AI Agent 在开发与运维过程中面临的工程化挑战,我们正式推出 Spring AI Alibaba Admin —— 一款面向生产级场景的一体化 AI Agent 应用研发治理平台。


项目地址:

https://github.com/spring-ai-alibaba/spring-ai-alibaba-admin


该平台深度集成配置管理、自动化评估体系与全链路可观测能力,覆盖 AI 应用从开发、调试、测试到上线、监控、优化的完整生命周期,全面支撑高效研发、质量保障与稳定运行。


平台提供四大核心能力:


1. Prompt 管理:实现 Prompt 的工程化与高效迭代

构建标准化的 Prompt 开发流程,助力 Prompt 工程师专业、高效地完成从设计到上线的全链路管理。


  • 模板管理:支持 Prompt 模板的创建、编辑与删除,内置代码高亮与语法提示,提升编写体验。
  • 版本控制:完整记录每次变更历史,支持版本对比与一键回滚,保障变更安全。
  • 实时调试:提供在线调试环境,支持流式响应预览,实现“即改即测”。
  • 会话管理:支持多轮对话模拟,还原真实交互场景,验证上下文连贯性。
  • 动态配置与热更新:与 Nacos 配置中心无缝集成,实现 Prompt 和模型参数的动态发布与实时生效,无需重启应用即可完成配置变更,显著提升迭代敏捷性。

1760945286195_85E65969-D483-4cbc-A926-803DCF4138D0.png

2. 数据集管理:构建高质量、可复用的评估数据资产

为 AI 应用评估提供可靠的数据基础,支持多样化数据源与真实场景还原。


  • 细粒度管理:支持数据项的增删改查及批量操作,便于维护大规模测试集。
  • 版本管理:数据集支持版本快照,可追溯历史变更并快速回退。
  • 链路数据复用:支持从 OpenTelemetry 链路中提取真实请求,自动生成测试数据集,精准复现线上问题。

1760945317699_0C9E8122-35A3-40b4-BE21-E44426DBEBAD.png

3. 评估器管理:建立可配置、可度量的评估体系

通过可视化方式定义评估逻辑,构建科学、一致的质量评判标准。


  • 评估器配置:支持准确性、相关性、合规性等多种维度的规则配置,灵活组合评估策略。
  • 预置模板:提供常用评估器模板,开箱即用,降低使用门槛。
  • 在线调试:支持单步执行与结果预览,快速验证评估逻辑正确性。
  • 版本发布:评估器支持版本管理与发布流程,确保生产环境一致性。
  • 结果报告:支持多评估器结果聚合展示,提供统一视图便于横向对比与综合分析。

1760945549032_D83CEF56-CF4A-4799-8BDB-D493F26B8EAB.png

4. 可观测性:让 AI 调用过程透明可控

深度集成 OpenTelemetry,全面追踪 AI 应用运行状态,提升可解释性与运维效率。


  • 链路追踪:完整记录每次 AI 请求的调用链路,涵盖 Prompt 渲染、模型调用、工具执行等环节。
  • 服务概览:提供服务级监控面板,掌握整体调用趋势与健康状态。
  • Trace 详情分析:支持 Span 级别拆解,精准定位性能瓶颈与异常节点。
  • 错误诊断:结合上下文日志与调用链,快速定位失败根因,缩短排障时间。

1760945569555_2C4CA07C-4E97-457c-AF58-83DFCFEA51EF.png

典型使用场景

场景一:Prompt 工程师的高效迭代

支持 Prompt 从开发、调试到上线的全生命周期管理,提升工程化水平。


  1. 在 Admin 平台创建和管理 Prompt 模板,实现标准化配置;
  2. 利用在线调试功能实时预览模型输出,快速完成多轮优化;
  3. 发布至 Nacos 配置中心,应用侧自动加载最新版本,实现无感更新;
  4. 通过版本对比功能量化优化效果,辅助决策上线时机。

场景二:AI 应用的质量保障

构建可度量、可重复的评估流程,保障 AI 输出的稳定性与可靠性。


  1. 构建覆盖核心业务场景的评估数据集,确保测试全面性;
  2. 配置多样化评估器(如准确性、合规性、一致性等),明确定义质量标准;
  3. 批量运行实验并自动化执行评估任务,提升评测效率;
  4. 基于可视化报告分析结果,持续优化模型与 Prompt 策略。

场景三:线上问题的快速定位与修复

结合链路追踪与评估能力,实现问题闭环处理。


  1. 在链路追踪页面定位异常请求,查看完整执行上下文;
  2. 分析调用链路中的各环节耗时与输出,精准识别故障节点;
  3. 从真实链路数据生成测试数据集,复现问题场景;
  4. 完成优化后重新评估,验证修复效果,形成“发现问题-优化-验证”的闭环。


03 操作教程


1. 克隆项目


git clone https://github.com/spring-ai-alibaba/spring-ai-alibaba-admin.git
cd admin


2. 配置您的 API 密钥

根据您的模型供应商,修改 spring-ai-alibaba-admin-server/model-config.yaml 的模型配置。

  • 如果您使用 DashScope,请参照 model-config-dashscope.yaml 模版进行配置。
  • 如果您使用 DeepSeek,请参照 model-config-deepseek.yaml 模版进行配置。
  • 如果您使用 OpenAI,请参照 model-config-openai.yaml 模版进行配置。

💡 获取您的 DashScope API 密钥:访问阿里云百炼控制台获取免费 API 密钥。

https://bailian.console.aliyun.com/?tab=model#/api-key


3. nacos配置(可选)

如果您需要修改 nacos 地址,请更新 spring-ai-alibaba-admin-server/src/main/resources/application.yml 文件中的配置。


nacos:  
  server-addr: ${nacos地址}


4. 启动SAA Admin

在根目录下,执行启动脚本。


sh start.sh


spring-ai-alibaba-admin-server 目录下启动应用程序:


mvn spring-boot:run


5. 访问应用

打开浏览器访问 http://localhost:8080 即可使用 SAA Admin 平台。


至此,您已经可以在平台中对 prompt 进行管理、调试、评估、可观测。如果您期望 Spring AI Alibaba Agent 应用能够集成 Nacos 以实现 prompt 加载以及动态更新,并且观测线上的运行情况,可以参照第六步配置您的 AI Agent 应用。


6. 连接您的 AI Agent 应用

在您的 Spring AI Alibaba Agent 应用中,引入如下依赖:


<dependencies>
    <!-- 引入spring ai alibaba agent nacos代理模块 -->
    <dependency>
        <groupId>com.alibaba.cloud.ai</groupId>
        <artifactId>spring-ai-alibaba-agent-nacos</artifactId>
        <version>{spring.ai.alibaba.version}</version>
    </dependency>
    <!-- 引入可观测模块 -->
    <dependency>
        <groupId>com.alibaba.cloud.ai</groupId>
        <artifactId>spring-ai-alibaba-autoconfigure-arms-observation</artifactId>
        <version>{spring.ai.alibaba.version}</version>
    </dependency>
    <!-- 用于实现各种 OTel 相关组件,如 Tracer、Exporter 的自动装载 -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-actuator</artifactId>
    </dependency>
    <!-- 用于将 micrometer 产生的指标数据对接到 otlp 格式 -->
    <dependency>
        <groupId>io.micrometer</groupId>
        <artifactId>micrometer-registry-otlp</artifactId>
    </dependency>
    <!-- 用于将 micrometer 底层的链路追踪 tracer 替换为 OTel tracer -->
    <dependency>
        <groupId>io.micrometer</groupId>
        <artifactId>micrometer-tracing-bridge-otel</artifactId>
    </dependency>
    <!-- 用于将 OTel tracer 产生的 span 按照 otlp 协议进行上报 -->
    <dependency>
        <groupId>io.opentelemetry</groupId>
        <artifactId>opentelemetry-exporter-otlp</artifactId>
    </dependency>
    <dependency>
        <groupId>org.springframework.ai</groupId>
        <artifactId>spring-ai-autoconfigure-model-tool</artifactId>
        <version>1.0.0</version>
    </dependency>
</dependencies>


指定 nacos 地址及 prompKey:


    spring.ai.alibaba.agent.proxy.nacos.serverAddr={ 替换 nacos address, 示例:127.0.0.1:8848}
    spring.ai.alibaba.agent.proxy.nacos.username={ 替换 nacos 用户名, 示例:nacos}
    spring.ai.alibaba.agent.proxy.nacos.password={ 替换 nacos 密码, 示例:nacos}
    spring.ai.alibaba.agent.proxy.nacos.promptKey={ 替换为promptKey,示例:mse-nacos-helper } 


设置可观测参数:


    management.otlp.tracing.export.enabled=true
    management.tracing.sampling.probability=1.0
    management.otlp.tracing.endpoint=http://{admin address}:4318/v1/traces
    management.otlp.metrics.export.enabled=false
    management.otlp.logging.export.enabled=false
    management.opentelemetry.resource-attributes.service.name=agent-nacos-prompt-test
    management.opentelemetry.resource-attributes.service.version=1.0
    spring.ai.chat.client.observations.log-prompt=true
    spring.ai.chat.observations.log-prompt=true
    spring.ai.chat.observations.log-completion=true
    spring.ai.image.observations.log-prompt=true
    spring.ai.vectorstore.observations.log-query-response=true
    spring.ai.alibaba.arms.enabled=true
    spring.ai.alibaba.arms.tool.enabled=true
    spring.ai.alibaba.arms.model.capture-input=true
    spring.ai.alibaba.arms.model.capture-output=true


04 未来规划


将持续增强 AI Agent 应用的研发支持能力,重点推进三方面建设:


  • 评估体系升级:突破当前以 Prompt 为核心的评估局限,逐步支持对 Tools、Rag 和 Agent 行为的综合评估。未来将覆盖多 Agent 协作场景的端到端效果评测,提供 Agent 间交互质量、任务协同效率等量化指标。
  • 链路追踪与分析能力增强:深化执行过程的可观测性,支持 Agent 决策路径的可视化展示,以及工具调用链路的完整追踪与分析,帮助开发者快速定位异常与优化瓶颈。
  • 智能化迭代能力构建:引入自动化与智能化机制,支持 A/B 测试的自动执行,探索使用 AI 算法构建数据集,根据评估结果自动调优参数、生成评估标准、提供 Prompt 优化建议等能力,提升迭代效率。


Spring AI Alibaba 后续会把内核升级为 AgentScope,持续为 Java 开发者打造自动装配、开箱即用的 Agent 开发框架。同时,Spring AI Alibaba Admin 将深度整合至 AgentScope Studio 中,共同构建覆盖开发、调试、评估与观测一体化 AI 应用研发平台。


Spring AI Alibaba 是一个开源项目,我们欢迎所有对 AI 和 Java 感兴趣的开发者参与共建!欢迎使用钉钉搜索群号:130240015687 加入 SAA 项目群。


点击此处,关注 Spring AI Alibaba。

相关文章
|
4月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3182 166
|
4月前
|
安全 前端开发 Java
《深入理解Spring》:现代Java开发的核心框架
Spring自2003年诞生以来,已成为Java企业级开发的基石,凭借IoC、AOP、声明式编程等核心特性,极大简化了开发复杂度。本系列将深入解析Spring框架核心原理及Spring Boot、Cloud、Security等生态组件,助力开发者构建高效、可扩展的应用体系。(238字)
|
4月前
|
人工智能 监控 Java
Spring AI Alibaba实践|后台定时Agent
基于Spring AI Alibaba框架,可构建自主运行的AI Agent,突破传统Chat模式限制,支持定时任务、事件响应与人工协同,实现数据采集、分析到决策的自动化闭环,提升企业智能化效率。
Spring AI Alibaba实践|后台定时Agent
|
4月前
|
人工智能 供应链 搜索推荐
拔俗AI 智能就业咨询服务平台:求职者的导航,企业的招聘滤网
AI智能就业平台破解求职招聘困局:精准匹配求职者、企业与高校,打破信息壁垒。简历诊断、岗位推荐、技能提升一站式服务,让就业更高效。
258 0
|
4月前
|
人工智能 搜索推荐 大数据
拔俗AI一体化数字销售服务平台:让企业销售更智能、更高效
AI一体化数字销售服务平台融合AI与大数据,集成客户管理、智能推荐、自动化跟进等功能,实现销售全流程智能化。打破传统模式困局,提升转化率与效率,助力企业降本增效,抢占数字化转型先机。(238字)
321 0
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1202 53
|
5月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1222 61
|
4月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
632 30
|
4月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
622 1
|
4月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。

热门文章

最新文章