Anthropic Managed Agents:把智能体从“聪明脚本”重构成“可编排系统”

简介: Managed Agents 并非给模型“加功能”,而是对智能体进行系统级重构:将大脑(决策)、手(执行)、记忆(状态)解耦为独立可调度角色,告别单体式脚本设计。它让智能体真正具备可管理、可扩展、可编排的系统属性,成为生产环境中的一等公民。

如果要用一句工程师能共鸣的话来概括 Anthropic 的 Managed Agents:

它不是在“给模型加功能”,而是在给智能体做系统级重构。

过去一年,Agent 这个词被用得太随意了:能调用几个工具、能自己循环思考、能跑一段时间,就被叫做智能体。但当你真的想把它放进生产环境——让它跑几个小时、接入公司内部系统、承担真实业务流程——你会发现一个根本问题:

大多数所谓的 Agent,本质上还是“包了一层工具调用逻辑的脚本”,而不是一个可管理、可扩展、可编排的系统组件。

Managed Agents 正是在解决这个落差。

一、问题的根源:智能体被做成了“单体应用”

传统 Agent 的典型实现方式,是把三件事绑死在一起:

  • 模型负责思考
  • 容器里跑工具、代码、文件操作
  • 上下文里塞着所有历史和状态

从工程视角看,这就是一个状态高度耦合的单体应用。它的问题不是“功能不够多”,而是边界不清、职责不分。这种设计会带来一连串连锁反应:

  • 容器一挂,任务、状态、执行环境一起死
  • 上下文一爆,历史要么被粗暴压缩,要么被丢弃
  • 工具凭证必须暴露在容器里,安全边界模糊
  • 想扩展到多 Agent 协作,几乎无从下手

换句话说,这种 Agent 更像是一个“聪明一点的脚本进程”,而不是一个可以被调度、被编排、被治理的系统角色。

二、核心转变:从“进程”到“角色”的抽象

Managed Agents 做的第一件事,就是把智能体从“一个进程”抽象成三个独立的系统角色:

  • 大脑:决策与控制
  • 手:执行与副作用
  • 记忆:状态与历史

这不是简单的模块拆分,而是从系统边界上重新定义智能体。在这个抽象下:

  • 大脑不再依赖某个具体容器
  • 手不再承载长期状态
  • 记忆不再被困在上下文窗口里

智能体从一个“跑在某个容器里的东西”,变成了一个可以被调度、被扩展、被组合的系统实体。

三、大脑:从“模型实例”到“无状态决策服务”

在传统设计里,模型往往被当成一个“长时间挂着的会话实例”:它既负责思考,又隐式地承载了一部分状态(上下文),还和执行环境绑在一起。Managed Agents 把这件事拆开了——大脑只做一件事:根据当前可见的信息,决定下一步该做什么。它不保存状态,不依赖某个容器,也不和具体执行环境绑定。这带来几个直接的工程后果:

  • 大脑可以随时重启,不影响任务整体进度
  • 可以横向扩展多个大脑实例,处理不同任务或不同阶段
  • 可以在不同物理环境中运行,而不影响执行层和存储层

从这个角度看,大脑更像是一个可调度的决策服务,而不是一个“被困在容器里的模型会话”。

四、手:从“附属执行环境”到“可替换的副作用层”

执行环境在很多 Agent 实现里是被忽视的:反正就是一个容器,能跑代码、能访问文件、能调工具就行。但在真实系统里,执行环境其实是风险最高、变化最快的一层:

  • 工具链会变
  • 依赖会升级
  • 权限要严格控制
  • 崩溃是常态而不是意外

Managed Agents 的做法,是把“手”变成一个纯执行层:它只负责产生副作用——跑代码、改文件、调 API——但不持有长期状态,也不掌握敏感凭证。凭证被放在更安全的地方,通过代理访问;执行环境可以随时销毁、重建、替换,而不会影响任务整体。这让“手”具备了两个关键特性:

  • 可抛弃:坏了就换,不需要抢救
  • 可组合:不同任务可以选择不同的执行环境,不必绑死在一个容器形态上

从工程视角看,这一步的意义在于:

执行环境从“模型的附属品”,变成了一个独立的、可治理的副作用层。

五、记忆:从“上下文负担”到“任务级时间线”

上下文窗口曾经是智能体系统里最尴尬的部分:它既是模型理解世界的入口,又是系统工程的瓶颈。传统做法是不断地:

  • 压缩历史
  • 总结对话
  • 丢弃细节

这些操作本质上都是不可逆的损失。一旦任务变长,智能体就会逐渐“失忆”。Managed Agents 把记忆从上下文里解放出来,变成一个任务级的事件时间线

  • 每一步操作、每一次调用、每一个结果,都是一条事件
  • 这些事件被持久化存储,而不是塞进上下文
  • 大脑在需要时,从这条时间线中选取相关片段,再构造上下文

这样一来:

  • 任务可以无限长,而不会因为上下文限制被迫“失忆”
  • 历史可以被回放、审计、分析,而不是被压缩成一段模糊总结
  • 多个大脑可以共享同一段任务历史,实现真正的协作

从系统设计角度看,这一步的本质是:

把“记忆”从模型的内部机制,提升为系统级的状态管理问题。

六、从单体到可编排:智能体开始具备“系统形态”

当大脑、手、记忆被拆成三个角色之后,智能体的形态就发生了质变。它不再是一个“长时间挂着的进程”,而是一个可以被编排的系统:

  • 某个阶段需要更多推理能力时,可以临时调度更多大脑实例
  • 某个任务需要特殊执行环境时,可以为它创建专用的手
  • 某个复杂流程可以拆成多个子任务,共享同一条任务时间线

这时再看“智能体操作系统”这个比喻,就不再是营销话术,而是一个相当准确的工程描述:你不再在“跑一个 Agent”,而是在调度一组具备不同职责的系统角色,共同完成一个长期任务。

七、工程师视角下的价值:不是“更聪明”,而是“更可控”

从模型能力的角度看,Managed Agents 并没有让 Claude 突然变得“更聪明”。它解决的不是“智能不够”的问题,而是“系统不可控”的问题。对工程师来说,它带来的价值更接近于:

  • 把智能体纳入现有的系统治理框架
  • 让智能体可以像微服务一样被监控、被审计、被扩展
  • 让长任务、复杂工具链、多智能体协作变得可设计、可推演

如果说早期的 Agent 更像是“在生产环境里偷偷跑的一个聪明脚本”,那么 Managed Agents 让它第一次有机会,成为系统架构中的一等公民

结语:从“能跑”到“能管”

很多人谈智能体时,关注的是“它能做什么”。而 Managed Agents 更关心的是:

当它真的开始做事,我们能不能看得清、控得住、撑得久。

这正是工程师在乎的东西。如果你把智能体当成一个长期存在的系统角色,而不是一次性脚本,那么 Anthropic 这次做的事情,其实非常朴素:把职责拆清、把边界划明、把状态外置、把执行解耦。听起来一点也不炫技,却非常“工程”。

目录
相关文章
|
2月前
|
人工智能 运维 安全
一个客户需求,捅穿了 Anthropic 整套 Agent 架构
Anthropic推出Claude Managed Agents,提出“脑手分离”架构:将Agent的“大脑”(Harness)、“手”(Sandbox)与“会话”(Session)解耦为独立组件。此举解决模型升级导致框架失效、私有云接入困难、安全凭据泄露等痛点,提升稳定性、安全性与性能(TTFT中位数降60%),并实现基础设施与模型能力的独立演进。
497 1
|
18天前
|
JSON JavaScript 前端开发
在TypeScript和JavaScript如何使用MetaMessage?
MetaMessage 是一种跨语言数据交换协议,支持 TypeScript/JavaScript(通过装饰器自动类型转换)、JSONC 文本与紧凑二进制 wire 格式,兼顾可读性、精度(如 bigint 表示 int64)与性能,旨在替代 JSON、Protobuf 等传统序列化方案。
210 125
|
2月前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
41645 72
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
2月前
|
人工智能 供应链 API
阿里云Coding Plan是什么?总是售罄怎么办?附解决攻略
阿里云Coding Plan因高性价比与顶级模型支持成开发者焦点,但Pro版每日9:30限量补货、秒罄难求。本文解析其价值,提供抢购技巧,并推荐百炼平台替代方案:免抢购、赠100万Tokens、按量付费,灵活适配各类需求。
627 5
|
2月前
|
机器学习/深度学习 缓存 测试技术
DeepSeek-V4开源:百万上下文,Agent能力比肩顶级闭源模型
DeepSeek-V4正式开源!含V4-Pro(1.6T参数)与V4-Flash(284B参数)双版本,均支持百万token上下文。首创混合注意力架构,Agent能力、世界知识与推理性能全面领先开源模型,数学/代码评测比肩顶级闭源模型。
4067 10
|
1月前
|
人工智能 缓存 安全
阿里云百炼Token Plan 标准坐席25,000 Credits 能用多少token或者调用次数?
阿里百炼Token Plan标准坐席198元/月,提供25,000 Credits额度(非固定Token数或调用次数)。支持多模型、全模态(文本/视觉/图像生成),动态计费,兼顾灵活与安全,适合轻度AI辅助团队。
|
2月前
|
人工智能 JSON 编解码
【SpringAIAlibaba新手村系列】(15)MCP Client 调用本地服务
本章从 MCP Client 视角说明如何连接上一章提供的本地服务,并把远端工具接入 ChatClient。重点讲解 Streamable-HTTP 配置、ToolCallbackProvider 的注入方式,以及模型如何通过 JSON-RPC 消息完成工具调用与结果回传。
546 21
|
人工智能 JavaScript Java
【SpringAIAlibaba新手村系列】(1)初识 Spring AI Alibaba 框架
本文介绍了SpringAIAlibaba框架的基本概念和使用方法。作为Spring官方AI框架的阿里云实现版本,它简化了Java开发者调用AI模型的过程。文章详细讲解了核心概念如ChatModel、ChatClient,以及阿里云百炼平台的功能。通过HelloWorld项目示例,展示了如何配置APIKey、编写控制层代码,实现普通调用和流式输出两种AI交互方式。重点阐述了SpringAI与SpringAIAlibaba的关系,以及自动配置机制的工作原理,帮助开发者快速上手这一框架。
5288 5
|
2月前
|
人工智能 机器人 Shell
在公司蒸馏我之前,我先赛博飞升
OpenClaw(龙虾)是一款开源AI数字分身框架,可本地或云端部署,支持多模型接入(Claude、Qwen、Ollama等)及钉钉/飞书/Telegram等10+聊天平台。它不止聊天,还能操作浏览器、读写文件、执行命令,并通过插件实现“蒸馏人物”、自动化办公等高级能力,主打隐私可控、真能干活。
463 11