AgentForge —— 让一句话变成一个生产可用的 Agent

简介: AgentForge是阿里飞猪自研的“Agent工厂”平台,支持非技术同学5分钟零代码造出真Loop Agent,Node/Java工程师可直接部署生产级Agent团队。平台内置ANVIL框架、FECHO网关、fliggy-memory-sdk等核心技术,打通BUC鉴权、Aone容器、钉钉、SchedulerX等集团生态,实现“一句话描述→自动装备→云端运行→多Agent编排”全链路闭环。

我们想解决什么

 

我们看到身边四类人,各自卡在不同的地方:

非技术同学有 AI 自动化需求(客服路由、值班播报、行程规划、辩论裁判、研发助理 ……),但他们不写代码、不懂 Prompt 结构、不知道怎么接 MCP、更搞不动容器部署 —— 想法烂在脑子里。

前端 / Node 技术同学虽然能写,但每造一个 Agent 都要从 0 搭一遍:Dockerfile、Aone 容器适配、Egg 启动脚本、调度框架接入、钉钉对接、记忆存储 …… 重复劳动累积起来比写真正的业务逻辑还多。

Java 同学是集团绝对主力,但 Agent 生态都是 Node / Python 系 —— 要么自学一套陌生语言栈,要么自己造一个简陋的 Java Agent 框架(多半半成品)。真正想要的是不碰 Node、不学 Prompt 工程,直接 HTTP 调用一个能跑业务的 Agent

ALL 我就想玩一下,自己搞个算命助手、模拟辩论法庭、日程安排,Qoderwork私人助手满足不了多人共享,还想让别人玩一下


idealab平台太轻,Agent 框架太重(OpenAI Agents SDK、LangGraph 都要写代码)。我们想把这一段路一次性填上 —— 一边让非技术同学不写代码就能造 Agent,一边给 Node 技术同学一套企业级、可直接部署上生产的全链路 SOP,再让 Java 同学无痛复用完整 Agent 架构


我们做了什么:AgentForge

AgentForge 是一个「Agent 工厂」型平台 —— 用户一句话描述需求,平台流式生成 Agent 的人设、技能链、工具装备,直接在浏览器里调试对话、配置定时任务、私有化部署到自己的 GitLab 仓库

 



对非技术同学:5 分钟出一个真 Loop Agent

1.描述 —— 一句话告诉 AI Builder「我要一个 Agent 能干嘛」

2.生成 —— Builder 流式生成 7 层 Prompt(SOUL / USER / AGENTS / SKILL_CHAIN / TOOLS / MEMORY ……)+ 自动匹配 Skill 和 MCP 装备

3.写自己的 Skill —— 上传 ZIP 即装,自动校验 + 沙盒预检;非技术同学也能用 Markdown 写一个 Skill 让 Agent 学会新本事

4.调试 —— 同一页面双模切换「装备 ↔ 对话」,改 Prompt 即时见效;带 SSE 事件流可以看每一步路由命中、工具调用、记忆召回

5.云端跑起来 —— 一键部署,云端就是一个搭载他们自己写的 Skill 的真 Loop Agent(不是简单的 Prompt 转发,是带 Function Calling 主循环、记忆召回、工具确认/重试的完整生产闭环)

对 Node 技术同学:直接拿走、直接上生产

我们直接搞定了:

Dockerfile 容器 —— APP-META/docker-config 全套,nodejsctl 标准 start_app / health_check / setenv 都齐

Aone 容器适配 —— 集团 Aone 平台的 node 原生 Agent 教授级落地,AONE_SCHEMA_NAME / AONE_ENV_SIGN 自动派生 EGG_SERVER_ENV,无需运维额外配置

直接可部署上生产的全链路 SOP —— 从 BUC 鉴权 → MySQL/Redis 配置 → Egg 启动 → migration 自动 apply → 健康检查,每一步都有现成模板可抄

Anvil Agent 框架 —— 每个派遣出去的 Agent 都基于 Anvil 启动,相当于把平台能力的子集打包成独立可部署的运行时;Anvil-Multi 进一步支持多 Agent 仓库

对 Java 同学:无痛复用完整 Agent 架构,不碰 Node 一行代码

Java 同学不需要学 Node、不需要懂 ReAct / Loop / Function Calling 那一套主循环实现,他们眼里的 AgentForge 就是一个 HTTP 服务

在浏览器里造一个 Agent(5 分钟,跟非技术同学路径一样)→ 自动得到一个生产可用的 Agent 实例

三条复用通道任选

HTTP API —— POST /api/chat 直接对话,SSE 流式响应;Java 服务 RestTemplate / WebClient 就能接

钉钉机器人 —— 把 Agent 挂到自己业务群,Java 后台跟用户 @ 一下互动,零代码

MCP 反向调用 —— Java 服务本身可以暴露成 MCP Server 让 Agent 调用,业务方法即工具

跨 Session 记忆中心化 —— Java 服务多次调用同一 Agent,记忆自动累积,不用自己存上下文

真正零侵入 —— Java 项目不引一行 Node 依赖、不要 LLM SDK key、不动 Maven pom,等价于把完整 Agent 架构装进了一个 HTTP 端点

集团 Java 服务的常见痛点 ——「我也想加 AI 能力但是不想搭一套 Node 栈」—— 在 AgentForge 这里直接绕过。

对小团队:单 Agent 自由编排成 Agent 战队

我们制定了一套 Agent 编排协议 —— 所有 AgentForge 生产的 Agent 都自带统一的对接契约(人设描述 / 能力声明 / 接收消息 / 回传结果),无论是哪个团队、哪个业务域造的,都能被随意拉进同一个 team 里组队作战:

可视化画布拖拽 —— TeamCanvas 上把任意几个已有 Agent 拖进画布,连一条 handoff 线就组成 Manager + Worker 战队,零代码

协议化的角色互通 —— 客服 Agent + 行程规划 Agent + 设计师 Agent 可以拼成「旅游业务一站式 team」;研发派单 Agent + 代码评审 Agent + 文档生成 Agent 可以拼成「研发流水线 team」;任意组合

hub-and-spoke 拓扑 + handoff 路由 —— Manager 拆解任务,按语义路由到最合适的 Worker,Worker 完成后回传 Manager 整合,支持多轮往返

共享记忆 / 共享 Skill 装备 —— team 内成员共享 namespace 记忆,知识沉淀不重复;每个成员仍保留自己的私有 Skill 不串味

效果:原本各团队各自维护一个 Agent,现在能跨团队拼成更强的复合 Agent1 + 1 > 2 的能力扩展不再需要重新写代码

怎么用

正向链路

STEP1:新建Agnet

 

STEP2:选择SOLO 还是 TEAM

 

SPEP3:描述生成初步的的系统提示词和推荐SKILL、MCP的草稿

 

开始装备你的agent

 

 

STEP4:开始使用

 


配套常用中心化能力

关联钉钉

定时任务

权限管控

 

 

 


一键私有化部署

 


 



我们的核心技术建设

 



AgentForge 能跑起来不是靠拼接现成轮子,底下是我们自己造的几大独立技术资产

fliggy-memory-sdk —— 飞猪自研的 mem0

不是简单接一下 OpenAI Memory / 第三方 SDK,是飞猪自研的、对标 mem0 的 Agent 长期记忆 SDK。完整覆盖 namespace 隔离、catalog 注入、topK 召回、事实抽取、衰减/合并/去重 —— mem0 能做的它都做,并且为集团内业务场景做了深度适配。Agent 跨 Session、跨用户、跨业务域的记忆复用全靠它,是飞猪在 AI 记忆基础设施上的独立技术资产。

FECHO —— 集团 HSF 自动变 MCP 的 MAX AGENT 网关

集团内成千上万的 HSF(High-Speed Service Framework)服务,过去 Agent 想用只能挨个写适配。FECHO 把集团所有 HSF 服务自动翻译成 MCP 服务 —— 任何 Agent 都能直接调用集团任何 RPC 接口,等于给 AI 时代造了一个统一的「集团服务 → Agent 调用」网关。这是 AgentForge 真正的"上限突破点":Agent 的能力边界 = 集团服务的全集,而不是几个手工接的 MCP。

ANVIL / ANVIL MULTI —— 真正的 Agent 框架,不是脚手架

派遣出去的 Agent 不是 LangGraph 包一下、也不是 OpenAI Agents SDK 套个壳 —— 是 ANVIL,自研的单 Agent 运行时框架;多 Agent 场景用 ANVIL MULTI。两套框架在集团 Aone 容器里跑通了从 BUC 鉴权 → 模型调用 → MCP 集成 → 调度触发 → 钉钉对接 → 监控审计的全链路生产闭环这是真"框架"不是"模板" —— 用户拿到的不是一份要自己改的代码骨架,是一套即装即跑的运行时。

chatLoop —— 自研的 ReAct + Function Calling 主循环

2200 行核心 + 5 子模块懒加载,类 Hermes / OpenClaw 的 Loop 主循环结构,但每一步都暴露 SSE 事件、工具确认 / 重试 / 跳过 / 历史压缩 / 错误兜底全是标准化 hook 点 —— 中文场景下比直接接 OpenAI Agents SDK 更可控,平台和 ANVIL 框架共用同一份核心。

7 层 Prompt 模板的权责分离标准

SOUL / USER / AGENTS / SKILL / SKILL_CHAIN / TOOLS / MEMORY 各自独立编辑、独立版本、独立复用,比扁平 system prompt 更适合复杂 Agent 的协作演进,也让"AI Builder 生成 → 用户手改 → 平台部署"全链路有标准化锚点。

我们串联了什么

我们把自家造的核心技术资产和集团生态拼成了一张网,让用户在一个浏览器界面里就能用到全部能力:

能力维度

自研

串联的集团生态

Agent 编排

自研编排协议 + TeamCanvas 可视化画布

——

Agent 运行时

ANVIL / ANVIL MULTI(自研框架)

Aone 容器 / nodejsctl

MCP 网关

FECHO(集团 HSF→MCP 网关)

HSF

Skill 市场

ali-skills(集团 Skill 仓库 CLI) + 自定义 ZIP 上传体系

open-aone

跨 Session 记忆

fliggy-memory-sdk(飞猪自研 mem0)

——

造 Agent 的 Agent

AgentBuilder(造 Agent 的 Agent)

——

鉴权 / 部署 / 调度 / IM

自研多环境一致性 SOP

BUC / Aone GitLab / SchedulerX / 钉钉机器人

横向看:自家底座是 ANVIL(框架)+ chatLoop(主循环)+ fliggy-memory-sdk(记忆)+ AgentBuilder(造 Agent 的 Agent)+ TeamCanvas(编排);集团生态串联的是 FECHO(HSF→MCP 网关)+ ali-skills(Skill 仓库)+ BUC / Aone / SchedulerX / 钉钉。两边拼在同一个浏览器界面里,对用户完全透明 —— 业务同学不用知道下面有这么多层。

我们怎么做的:把碎片化能力系统化成解决方案

光有自家造的核心技术资产还不够 —— 让它们能长期演化、跨团队复用、零踩坑接入,靠的是一套工程组织哲学:

Agent 生命周期五阶段标准 —— 生成 → 装备 → 调试 → 部署 → 调度,每一阶段抽象成独立模块 + 标准契约。任何阶段单独迭代(换调度后端、换生成策略、换部署目标)都不破坏其他阶段,整套系统能持续演化而不变成屎山

多环境一致性工程标准 —— dev / pre / prod 同代码同行为,靠 config.{env}.ts + Aone 派生 EGG_SERVER_ENV 自动切换,migration 自动 apply,生产容器零额外配置启动

DB-first + 文件 fallback 双模存储 —— 生产 RDS 完整持久化,本地零 MySQL 也能跑全套;降级路径在线上线下都被验证过,不是"理论上可用"

Skill / MCP / Memory 三类扩展点协议化 —— 任何团队按契约写就能扩展(Skill manifest + 5 子模块、MCP 三传输统一封装、Memory namespace + catalog),平台不需要每次都改代码

一句话总结:别人在做"造一个能跑的 Agent",我们在做"造一套让任何人都能造 Agent 的标准体系" —— 底下有 fliggy-memory-sdk / FECHO / ANVIL 三块自家造的核心技术资产撑着

我们做出了什么

平台已稳定运行,平台已私有化部署多个业务线agent

已沉淀的真实 Agent:客服路由助理 / 研发任务派单 / 辩论赛庭 / 值班播报 / 行程规划 ……

完整链路打通:BUC 鉴权 / Aone GitLab 部署 / SchedulerX 调度 / 钉钉机器人 / 集团内 MCP 服务

我们想往哪走

短期:把"造一个 Agent"的门槛压到完全不懂技术的业务同学也能上手,目标 5 分钟出首个 Agent

中期:让 Agent 之间能互相调用,组成更复杂的"Agent 生态" —— 每个团队都有自己的 Anvil 仓库矩阵,业务能力像乐高一样拼出来。

我们相信,下一波生产力解放不来自更强的模型,来自让"造 Agent"这件事变成普通人能完成的事,让"部署 Agent 上生产"这件事变成不需要专门搭一遍轮子的事。AgentForge 是我们交出的第一份答卷。



体验地址:

预发: https://pre-agent-forge.alibaba-inc.com/(不断增加能力)

线上:https://agent-forge.alibaba-inc.com/(稳定)


来源  |  阿里云开发者公众号

作者  |  宋英男(祁南)

相关文章
|
16小时前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
7396 32
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
16小时前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
640 142
|
16小时前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
|
16小时前
|
人工智能 安全 定位技术
CodeGraph深度解析 让Claude Code工具调用直降七成的核心原理与实操教程
如今以Claude Code为代表的AI编程智能体已经成为开发者日常编码、项目重构、漏洞修复的必备工具。但在长期使用过程中,几乎所有开发者都会遇到同一个明显痛点:AI虽然具备强大的代码生成与分析能力,却常常陷入盲目探索的循环中。
1248 2
|
16小时前
|
人工智能 弹性计算 运维
阿里云发布堡垒机智能运维Agent,运维交互进入自然语言新时代
支持自然语言运维,提升效率与安全双保障。
1165 1
|
16小时前
|
存储 定位技术 数据库
CodeGraph 如何让 Claude Code减少 7 成工具调用?
CodeGraph 为 Coding Agent 提供本地代码知识图谱,把函数、类、调用链和框架路由提前整理成“项目地图”,减少盲目搜索和文件读取。它不是新 Agent,而是上下文基础设施,让 Agent 更快找到正确代码路径,平均减少 7 成工具调用。
1304 4
|
16小时前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
373 4
|
16小时前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
328 1
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
16小时前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
16小时前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
448 1