从编排流程到设计环境:我们为什么彻底重构 Agent 的开发方式

简介: JVS Crew是阿里云企业级AI智能体平台,摒弃传统编排范式,首创“环境范式”:智能在模型,执行在沙箱。通过Harness四层架构,实现安全隔离、动态决策、全链路可观测与渐进式交付,让Agent越用越聪明。

问题是怎么暴露的

我们在做 JVS Crew 的过程中,遇到过一个时刻:

团队辛苦维护了几个月的 Agent 流程图,因为上游模型升级,大量手写的 if-else 分支逻辑变得多余——但它不会自动消失,你必须手动清理。与此同时,新增一个边缘业务场景,意味着找到流程图里正确的插入点、新加节点、调整连线、重新回归测试。节点数量一旦超过几十个,理解这套流程图本身的成本就已经很高了。

这不是技术债,这是范式选错了


两代范式,核心差异只有一句话

第一代:智能在流程里,模型是执行引擎。
工程师把任务拆成节点,用连线定义分支逻辑,模型只负责在每个节点"填空"。控制流是显式的、硬编码的。

第二代:智能在模型里,环境是执行舞台。
工程师构建沙箱、工具链、护栏和反馈循环,模型负责自主规划和动态决策。你不再告诉它"第一步做什么",而是告诉它"你能用什么、你的边界在哪",然后让它自己决定怎么做。

这个差异,带来的结果是:

维度 编排范式 环境范式
维护成本 随规则数量线性上升 只需更新 Prompt 和工具描述
能力天花板 受限于流程图覆盖范围 随模型能力提升自动抬升
资产价值 贬值资产 — 规则写死 增值资产 — 随模型进化增值

最关键的一点:编排范式产出的是贬值资产。 你根据当前模型能力设计的那套节点和分支,会随着模型升级而失效——但它不会自动修复自己。


为什么是现在切换

不是工程师主观想换代,是三个因素叠加让旧范式变得不经济:

1. 模型能力跨过了阈值。 2025-2026 年的模型,自主规划、多步骤工具调用、异常处理的能力已经成熟到足以托付控制权。"编排每一步"变成了一种限制,而不是保障。

2. 维护成本出现了拐点。 当维护一张流程图的成本,超过维护一套 Prompt 和工具描述的成本,旧账就算不过来了。

3. 投资逻辑根本变了。 投资流程是在投资一套特定于当前模型能力的规则;投资环境是在投资一套约束条件——模型越强,同一个约束环境能发挥的价值越大。每一次全球模型升级,你的平台都在被动获益。


行业独立验证了同一个方向

这不是一个团队的判断。2025-2026 年,多个头部团队独立走到了类似的结论:

  • 某头部模型厂商把"大脑"(Agent)和"双手"(Environment)彻底拆开,Session 作为一等公民独立管理——不是请求-响应模型,是持久运行的执行实体
  • 某云厂商提供最长 8 小时的持续执行,配合事件流和断线重连,中途断开进度不丢
  • 某沙箱服务商把隔离执行做到 microVM 150ms 启动,为 Agent 脉冲式负载专门优化

我们 JVS Crew 团队是独立立项的,没有参照上述方案,但走出了类似的路。多个团队互不通气却得出同构结论,这是行业演进的信号,不是巧合。


我们怎么做的:Harness 四层架构

我们把"模型之外的部分"统称为 Harness。它不是功能堆砌,是一套控制架构:

┌─────────────────────────────────────┐
│  接入层与消息网关                    │
│  钉钉 / 飞书 / 企微 / QQ 统一接入   │
├─────────────────────────────────────┤
│  智能体编排与运行时                  │
│  ReAct 推理循环 · Multi-Agent 协作  │
│  Context 分层管理 · 人机协同干预    │
├─────────────────────────────────────┤
│  安全沙箱执行环境                    │
│  受控工具执行 · MCP Server 调用     │
│  身份校验 · 技能预加载              │
├─────────────────────────────────────┤
│  持久化数据层                        │
│  加密凭证托管 · 企业 Skill 资产     │
└─────────────────────────────────────┘

几个关键设计决策:

状态管理外部持久化,而不是压缩上下文。 Session 是独立的持久化事件日志,Harness 灵活查询和恢复状态。任务超出上下文窗口时,不做不可逆的信息丢弃。

工具集成全面转向 MCP 标准协议。 写一次工具连接器,跨框架和模型复用。不锁定在任何特定框架里。

控制流从黑盒变成可观测的事件流。 SSE 实时透出模型的思考、工具调用、执行结果。执行(生成)和监控(评估)是独立的两个环节,工程师可以介入。

渐进式启用。 只开核心三层就是托管型 Agent 运行时,全部开启才是完整企业级平台。企业可以按需解锁多租户、权限、审计、计费。


两个使用模式,共用同一套底座

模式 体验 适用场景
声明式配置 + 全托管 控制台配置 Agent Profile、System Prompt、安全围栏、技能组合、Channel,一键交付 企业内部快速构建和上线 Agent
原子化 API REST API + 多语言 SDK,Session 管理、双向事件流、人在回路 ISV 集成进自有产品,深度定制

C 端个人版(JVS Claw)和 B 端企业版(JVS Crew)共用同一套 Harness 架构——Agent 执行层本质没有区别,区别只在外围的多租户、权限、审计、计费。


一个不那么确定的预测

有人说 Harness 最终会消亡——随着模型足够强,工具选择、错误恢复、上下文管理都会由模型自主完成,Harness 会收缩为一个极简的"护栏"。

我们的判断是:形态会变,但核心价值不会消失。把模型的智能约束在安全、可控、可观测的环境中,这件事本身不会过时。 一个能执行任意代码的 AI 系统,既强大又危险。Harness 是唯一一种既能放开手让 Agent 干活、又能管控它的方式。


给正在构建 Agent 产品的团队

如果你现在还在维护一张复杂的流程图,可以问自己几个问题:

  • 这套流程,在模型升级后能自动受益,还是必须手动修改?
  • 你的状态管理是内存里的对话历史,还是外部持久化的事件日志?
  • 你的工具集成是框架专属的包装器,还是基于 MCP 这样的标准协议?

范式跃迁不是选择题,是时间问题。越早把投资方向从"流程"转向"环境",后面的维护账越好算。

相关文章
|
29天前
|
人工智能 Serverless API
托管 Agent 执行循环只是起点,AgentRun 托管的更是企业 AI 生产全链路
本文对比分析函数计算 AgentRun 与 Claude Managed Agents 架构:二者均以 Agent/Environment/Session/Events 为核心,但 AgentRun 在模型自由、VPC 数据不出域、多语言代码解释器、浏览器自动化、统一凭证管理及 OpenTelemetry 可观测性等方面更具企业级优势。
|
29天前
|
安全 机器人 Windows
OpenClaw 接入 QQ 机器人完整图文教程 从零配置可直接复制使用
本文详解OpenClaw(小龙虾)本地Windows版接入QQ机器人的完整流程:从QQ开放平台扫码创建机器人、获取AppID/AppSecret,到OpenClaw端安装插件、填写密钥、启用通道并测试回复,7步即可完成,零代码门槛,安全高效。(239字)
|
29天前
|
存储 缓存 人工智能
当 Agent 从模型调用,走向系统工程:OpenAI 和 LangChain 的两种实践
OpenAI与LangChain最新实践揭示:AI Agent 正从“模型调用”迈向“系统工程”。前者以 WebSocket 优化API链路,提速40%;后者强调Feedback驱动Trace闭环,实现持续演进。效率与进化,缺一不可。
291 8
|
存储 资源调度 Kubernetes
Kubernetes多租户集群实践
如何解决多租户集群的安全隔离问题是企业上云的一个关键问题,本文主要介绍kubernetes多租户集群的基本概念和常见应用形态,以及在企业内部共享集群的业务场景下,基于kubernetes原生和ACK集群现有安全管理能力快速实现多租户集群的相关方案。
4914 0
|
5月前
|
人工智能 安全 数据可视化
AI 编程让研发:聚焦核心,远离低效内耗
AI编程革新研发模式:通过规范驱动、沙箱防护、无缝协作与多模型适配,解决代码漏洞、安全风险、协作低效等痛点,让开发者聚焦创新,提升效率与质量,实现技术价值回归。
432 10
|
1月前
|
SQL 存储 关系型数据库
MySQL介绍:零基础入门,读懂这款主流关系型数据库
MySQL是全球最流行的开源关系型数据库,由瑞典MySQL AB公司开发,现属Oracle旗下。它基于SQL语言,以表格组织数据,支持事务(ACID)、高并发与多平台部署,免费易用、性能稳定,广泛应用于网站、企业系统及移动应用等场景。
407 3
|
16天前
|
人工智能 运维 监控
阿里云的 Agent Infra 长什么样
分享了团队在 Agent 工程化领域的完整思考与产品实践,从构建、部署到规模化运行,如何用一套 Agent Infra 覆盖智能体的开发-运行-治理-运维-优化全周期。
|
2月前
|
人工智能 弹性计算 运维
阿里云发布 Agentic OS:首个面向 Agent 的操作系统
2026年3月,阿里云发布全球首款面向AI Agent的操作系统Agentic OS。它以“Agent为用户主体”,通过原生Skill封装、Copilot Shell交互、AgentSecCore全链路安全防护三大突破,显著降低Token消耗、提升部署效率与运行安全性,推动计算范式从“软件负载”迈向“智能体负载”。