AgentForge —— 让一句话变成一个生产可用的 Agent

简介: AgentForge是阿里飞猪自研的“Agent工厂”平台,支持非技术同学5分钟零代码造出真Loop Agent,Node/Java工程师可直接部署生产级Agent团队。平台内置ANVIL框架、FECHO网关、fliggy-memory-sdk等核心技术,打通BUC鉴权、Aone容器、钉钉、SchedulerX等集团生态,实现“一句话描述→自动装备→云端运行→多Agent编排”全链路闭环。

我们想解决什么

 

我们看到身边四类人,各自卡在不同的地方:

非技术同学有 AI 自动化需求(客服路由、值班播报、行程规划、辩论裁判、研发助理 ……),但他们不写代码、不懂 Prompt 结构、不知道怎么接 MCP、更搞不动容器部署 —— 想法烂在脑子里。

前端 / Node 技术同学虽然能写,但每造一个 Agent 都要从 0 搭一遍:Dockerfile、Aone 容器适配、Egg 启动脚本、调度框架接入、钉钉对接、记忆存储 …… 重复劳动累积起来比写真正的业务逻辑还多。

Java 同学是集团绝对主力,但 Agent 生态都是 Node / Python 系 —— 要么自学一套陌生语言栈,要么自己造一个简陋的 Java Agent 框架(多半半成品)。真正想要的是不碰 Node、不学 Prompt 工程,直接 HTTP 调用一个能跑业务的 Agent

ALL 我就想玩一下,自己搞个算命助手、模拟辩论法庭、日程安排,Qoderwork私人助手满足不了多人共享,还想让别人玩一下


idealab平台太轻,Agent 框架太重(OpenAI Agents SDK、LangGraph 都要写代码)。我们想把这一段路一次性填上 —— 一边让非技术同学不写代码就能造 Agent,一边给 Node 技术同学一套企业级、可直接部署上生产的全链路 SOP,再让 Java 同学无痛复用完整 Agent 架构


我们做了什么:AgentForge

AgentForge 是一个「Agent 工厂」型平台 —— 用户一句话描述需求,平台流式生成 Agent 的人设、技能链、工具装备,直接在浏览器里调试对话、配置定时任务、私有化部署到自己的 GitLab 仓库

 



对非技术同学:5 分钟出一个真 Loop Agent

1.描述 —— 一句话告诉 AI Builder「我要一个 Agent 能干嘛」

2.生成 —— Builder 流式生成 7 层 Prompt(SOUL / USER / AGENTS / SKILL_CHAIN / TOOLS / MEMORY ……)+ 自动匹配 Skill 和 MCP 装备

3.写自己的 Skill —— 上传 ZIP 即装,自动校验 + 沙盒预检;非技术同学也能用 Markdown 写一个 Skill 让 Agent 学会新本事

4.调试 —— 同一页面双模切换「装备 ↔ 对话」,改 Prompt 即时见效;带 SSE 事件流可以看每一步路由命中、工具调用、记忆召回

5.云端跑起来 —— 一键部署,云端就是一个搭载他们自己写的 Skill 的真 Loop Agent(不是简单的 Prompt 转发,是带 Function Calling 主循环、记忆召回、工具确认/重试的完整生产闭环)

对 Node 技术同学:直接拿走、直接上生产

我们直接搞定了:

Dockerfile 容器 —— APP-META/docker-config 全套,nodejsctl 标准 start_app / health_check / setenv 都齐

Aone 容器适配 —— 集团 Aone 平台的 node 原生 Agent 教授级落地,AONE_SCHEMA_NAME / AONE_ENV_SIGN 自动派生 EGG_SERVER_ENV,无需运维额外配置

直接可部署上生产的全链路 SOP —— 从 BUC 鉴权 → MySQL/Redis 配置 → Egg 启动 → migration 自动 apply → 健康检查,每一步都有现成模板可抄

Anvil Agent 框架 —— 每个派遣出去的 Agent 都基于 Anvil 启动,相当于把平台能力的子集打包成独立可部署的运行时;Anvil-Multi 进一步支持多 Agent 仓库

对 Java 同学:无痛复用完整 Agent 架构,不碰 Node 一行代码

Java 同学不需要学 Node、不需要懂 ReAct / Loop / Function Calling 那一套主循环实现,他们眼里的 AgentForge 就是一个 HTTP 服务

在浏览器里造一个 Agent(5 分钟,跟非技术同学路径一样)→ 自动得到一个生产可用的 Agent 实例

三条复用通道任选

HTTP API —— POST /api/chat 直接对话,SSE 流式响应;Java 服务 RestTemplate / WebClient 就能接

钉钉机器人 —— 把 Agent 挂到自己业务群,Java 后台跟用户 @ 一下互动,零代码

MCP 反向调用 —— Java 服务本身可以暴露成 MCP Server 让 Agent 调用,业务方法即工具

跨 Session 记忆中心化 —— Java 服务多次调用同一 Agent,记忆自动累积,不用自己存上下文

真正零侵入 —— Java 项目不引一行 Node 依赖、不要 LLM SDK key、不动 Maven pom,等价于把完整 Agent 架构装进了一个 HTTP 端点

集团 Java 服务的常见痛点 ——「我也想加 AI 能力但是不想搭一套 Node 栈」—— 在 AgentForge 这里直接绕过。

对小团队:单 Agent 自由编排成 Agent 战队

我们制定了一套 Agent 编排协议 —— 所有 AgentForge 生产的 Agent 都自带统一的对接契约(人设描述 / 能力声明 / 接收消息 / 回传结果),无论是哪个团队、哪个业务域造的,都能被随意拉进同一个 team 里组队作战:

可视化画布拖拽 —— TeamCanvas 上把任意几个已有 Agent 拖进画布,连一条 handoff 线就组成 Manager + Worker 战队,零代码

协议化的角色互通 —— 客服 Agent + 行程规划 Agent + 设计师 Agent 可以拼成「旅游业务一站式 team」;研发派单 Agent + 代码评审 Agent + 文档生成 Agent 可以拼成「研发流水线 team」;任意组合

hub-and-spoke 拓扑 + handoff 路由 —— Manager 拆解任务,按语义路由到最合适的 Worker,Worker 完成后回传 Manager 整合,支持多轮往返

共享记忆 / 共享 Skill 装备 —— team 内成员共享 namespace 记忆,知识沉淀不重复;每个成员仍保留自己的私有 Skill 不串味

效果:原本各团队各自维护一个 Agent,现在能跨团队拼成更强的复合 Agent1 + 1 > 2 的能力扩展不再需要重新写代码

怎么用

正向链路

STEP1:新建Agnet

 

STEP2:选择SOLO 还是 TEAM

 

SPEP3:描述生成初步的的系统提示词和推荐SKILL、MCP的草稿

 

开始装备你的agent

 

 

STEP4:开始使用

 


配套常用中心化能力

关联钉钉

定时任务

权限管控

 

 

 


一键私有化部署

 


 



我们的核心技术建设

 



AgentForge 能跑起来不是靠拼接现成轮子,底下是我们自己造的几大独立技术资产

fliggy-memory-sdk —— 飞猪自研的 mem0

不是简单接一下 OpenAI Memory / 第三方 SDK,是飞猪自研的、对标 mem0 的 Agent 长期记忆 SDK。完整覆盖 namespace 隔离、catalog 注入、topK 召回、事实抽取、衰减/合并/去重 —— mem0 能做的它都做,并且为集团内业务场景做了深度适配。Agent 跨 Session、跨用户、跨业务域的记忆复用全靠它,是飞猪在 AI 记忆基础设施上的独立技术资产。

FECHO —— 集团 HSF 自动变 MCP 的 MAX AGENT 网关

集团内成千上万的 HSF(High-Speed Service Framework)服务,过去 Agent 想用只能挨个写适配。FECHO 把集团所有 HSF 服务自动翻译成 MCP 服务 —— 任何 Agent 都能直接调用集团任何 RPC 接口,等于给 AI 时代造了一个统一的「集团服务 → Agent 调用」网关。这是 AgentForge 真正的"上限突破点":Agent 的能力边界 = 集团服务的全集,而不是几个手工接的 MCP。

ANVIL / ANVIL MULTI —— 真正的 Agent 框架,不是脚手架

派遣出去的 Agent 不是 LangGraph 包一下、也不是 OpenAI Agents SDK 套个壳 —— 是 ANVIL,自研的单 Agent 运行时框架;多 Agent 场景用 ANVIL MULTI。两套框架在集团 Aone 容器里跑通了从 BUC 鉴权 → 模型调用 → MCP 集成 → 调度触发 → 钉钉对接 → 监控审计的全链路生产闭环这是真"框架"不是"模板" —— 用户拿到的不是一份要自己改的代码骨架,是一套即装即跑的运行时。

chatLoop —— 自研的 ReAct + Function Calling 主循环

2200 行核心 + 5 子模块懒加载,类 Hermes / OpenClaw 的 Loop 主循环结构,但每一步都暴露 SSE 事件、工具确认 / 重试 / 跳过 / 历史压缩 / 错误兜底全是标准化 hook 点 —— 中文场景下比直接接 OpenAI Agents SDK 更可控,平台和 ANVIL 框架共用同一份核心。

7 层 Prompt 模板的权责分离标准

SOUL / USER / AGENTS / SKILL / SKILL_CHAIN / TOOLS / MEMORY 各自独立编辑、独立版本、独立复用,比扁平 system prompt 更适合复杂 Agent 的协作演进,也让"AI Builder 生成 → 用户手改 → 平台部署"全链路有标准化锚点。

我们串联了什么

我们把自家造的核心技术资产和集团生态拼成了一张网,让用户在一个浏览器界面里就能用到全部能力:

能力维度

自研

串联的集团生态

Agent 编排

自研编排协议 + TeamCanvas 可视化画布

——

Agent 运行时

ANVIL / ANVIL MULTI(自研框架)

Aone 容器 / nodejsctl

MCP 网关

FECHO(集团 HSF→MCP 网关)

HSF

Skill 市场

ali-skills(集团 Skill 仓库 CLI) + 自定义 ZIP 上传体系

open-aone

跨 Session 记忆

fliggy-memory-sdk(飞猪自研 mem0)

——

造 Agent 的 Agent

AgentBuilder(造 Agent 的 Agent)

——

鉴权 / 部署 / 调度 / IM

自研多环境一致性 SOP

BUC / Aone GitLab / SchedulerX / 钉钉机器人

横向看:自家底座是 ANVIL(框架)+ chatLoop(主循环)+ fliggy-memory-sdk(记忆)+ AgentBuilder(造 Agent 的 Agent)+ TeamCanvas(编排);集团生态串联的是 FECHO(HSF→MCP 网关)+ ali-skills(Skill 仓库)+ BUC / Aone / SchedulerX / 钉钉。两边拼在同一个浏览器界面里,对用户完全透明 —— 业务同学不用知道下面有这么多层。

我们怎么做的:把碎片化能力系统化成解决方案

光有自家造的核心技术资产还不够 —— 让它们能长期演化、跨团队复用、零踩坑接入,靠的是一套工程组织哲学:

Agent 生命周期五阶段标准 —— 生成 → 装备 → 调试 → 部署 → 调度,每一阶段抽象成独立模块 + 标准契约。任何阶段单独迭代(换调度后端、换生成策略、换部署目标)都不破坏其他阶段,整套系统能持续演化而不变成屎山

多环境一致性工程标准 —— dev / pre / prod 同代码同行为,靠 config.{env}.ts + Aone 派生 EGG_SERVER_ENV 自动切换,migration 自动 apply,生产容器零额外配置启动

DB-first + 文件 fallback 双模存储 —— 生产 RDS 完整持久化,本地零 MySQL 也能跑全套;降级路径在线上线下都被验证过,不是"理论上可用"

Skill / MCP / Memory 三类扩展点协议化 —— 任何团队按契约写就能扩展(Skill manifest + 5 子模块、MCP 三传输统一封装、Memory namespace + catalog),平台不需要每次都改代码

一句话总结:别人在做"造一个能跑的 Agent",我们在做"造一套让任何人都能造 Agent 的标准体系" —— 底下有 fliggy-memory-sdk / FECHO / ANVIL 三块自家造的核心技术资产撑着

我们做出了什么

平台已稳定运行,平台已私有化部署多个业务线agent

已沉淀的真实 Agent:客服路由助理 / 研发任务派单 / 辩论赛庭 / 值班播报 / 行程规划 ……

完整链路打通:BUC 鉴权 / Aone GitLab 部署 / SchedulerX 调度 / 钉钉机器人 / 集团内 MCP 服务

我们想往哪走

短期:把"造一个 Agent"的门槛压到完全不懂技术的业务同学也能上手,目标 5 分钟出首个 Agent

中期:让 Agent 之间能互相调用,组成更复杂的"Agent 生态" —— 每个团队都有自己的 Anvil 仓库矩阵,业务能力像乐高一样拼出来。

我们相信,下一波生产力解放不来自更强的模型,来自让"造 Agent"这件事变成普通人能完成的事,让"部署 Agent 上生产"这件事变成不需要专门搭一遍轮子的事。AgentForge 是我们交出的第一份答卷。



体验地址:

预发: https://pre-agent-forge.alibaba-inc.com/(不断增加能力)

线上:https://agent-forge.alibaba-inc.com/(稳定)


来源  |  阿里云开发者公众号

作者  |  宋英男(祁南)

相关文章
|
20天前
|
人工智能 Java Shell
AI 不缺智商缺纪律:我的 Harness 工程化实践
核心观点:AI Coding 的瓶颈正从"模型能力"转移到"流程工程"——模型已经足够聪明,但不稳定,而稳定性必须由外部框架供给。 读完你能带走:一套可抄的 harness 分层结构、一个把"流程当被测对象"的评测方法、4 条用代价换来的踩坑教训,以及一个能迁移到任何 AI 工作流的工程化模式。
444 0
|
4月前
|
人工智能 运维 机器人
我用开源项目把 AI Agent 和钉钉打通了,现在能查人、发消息、管文档
dingtalk-skills 是面向 AI Agent 的钉钉技能库(v0.4.0),零代码、零依赖,一行命令安装。现支持知识库、AI表格、消息发送、待办、通讯录5大核心场景,对话即可操作钉钉,已开源。
908 1
|
Python Windows
JetBrains 插件市场安装 Cloud Toolkit
通过 JetBrains 插件市场安装 Alibaba Cloud Toolkit
54844 0
JetBrains 插件市场安装 Cloud Toolkit
|
Java Maven
最快的 maven repository--阿里镜像仓库
国内速度超快的maven repository
162967 0
|
20天前
|
存储 人工智能 自然语言处理
阿里云骡子快跑 MuleRun详解:功能用途、收费标准及完整使用指南
阿里云MuleRun(骡子快跑)是一站式AI原生智能工作空间,支持自然语言驱动任务执行,具备四层记忆、主动智能与可信沙箱等能力,深度集成电商、CRM等数据源,助力企业自动化运营、多平台触达与分析提效。提供Team版(420元/席/月)和Enterprise版(2500元/席/年)。MuleRun(骡子快跑)官网:https://t.aliyun.com/U/gSCv7v
|
20天前
|
人工智能 自然语言处理 API
阿里云海外重磅发布 Qwen Cloud
Qwen Cloud,正是为AI Agent 而生的全新服务方式。
1870 57
|
20天前
|
JSON 人工智能 自然语言处理
基于顶级 Agent(Claude Code)的 Harness 工程搭建式业务 Agent 评测方案
用一个强 Agent 构建评测 Harness,系统性评测一群业务 Agent(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)
150 0
|
20天前
|
弹性计算 人工智能 运维
阿里云无影云电脑官网:个人版和企业版区别及收费价格、APP下载链接、免费3个月申请攻略
阿里云无影云电脑提供个人版(按核时计费,黄金款14.9元/月起)与企业版(包月套餐,4核8G仅199元/年),支持Windows/macOS/手机多端接入。APP下载及免费试用(1个月)详见官方页面。阿里云无影官网:https://t.aliyun.com/U/4fqTBa
161 1
|
4月前
|
IDE 编译器 开发工具
别再只盯着Keil了!看看IAR和CCS能拯救你多少脑细胞
本文深度对比Keil、IAR与TI CCS三大嵌入式IDE:Keil胜在生态成熟、入门友好;IAR以极致编译优化和安全认证见长;CCS则专精TI芯片,多核调试能力突出。从编译器性能、调试深度、RTOS支持到CI/CD适配,全面解析各自优势与痛点,并探讨VS Code+GCC等开源方案的崛起挑战。(239字)
893 2