从单兵作战到团队协作:AgentRun的多Agent生产级协作方案

简介: AgentRun提供多 Agent 生产级协作方案,解决多 Agent 发现、调用、鉴权、编排与治理难题;通过工作空间实现环境隔离与统一管理,让开发者专注 Agent 能力本身,真正实现“协作如调 API 一般简单”。

作者:丛霄,悠逸

单个 Agent 再强,也只是一个人在战斗。真正的生产力倍增,来自多个专职 Agent 的协同——而 AgentRun 让这件事变得像调一个 API 一样简单。
多 Agent 并不是新概念,难点也不在于把任务拆给几个 Agent。真正卡住生产落地的,是拆完之后怎么让它们稳定地互相发现、互相调用、互相信任,并且在团队、环境、权限和链路追踪上可管理。 AgentRun 的定位正是把这部分工程复杂度收敛到平台: 用 A2A 开放协议打破智能体孤岛,用工作空间提供生产级管理,让开发者把精力放回 Agent 能力本身。

## 一、从单 Agent 到多 Agent:为什么协作难落地
单个 Agent 再强大,面对跨领域的复杂任务,终究会遇到能力边界。一个「点咖啡」的 Agent 不应该知道怎么「安排配送」,一个「写代码」的 Agent 不应该知道怎么「审批流程」。更合理的方式,是让不同 Agent 各司其职,再通过协作机制互相发现、互相调用。 问题在于,自建一套多 Agent 系统并不只是“多写几个 Agent”。你还需要自己解决一整套平台工程问题:
  • 注册中心:哪些 Agent 在线?属于哪个环境?当前地址是什么?
  • 服务发现:调用方如何找到合适的 Agent?如何读取它的能力描述?
  • 跨 Agent 鉴权:谁可以发现谁、调用谁?凭证如何轮转?
  • 调度编排:复杂任务如何拆解、分发、重试、聚合结果?
  • 环境隔离:开发、测试、生产的 Agent 如何避免互相串用?
  • 链路追踪:一次用户请求跨多个 Agent 后,如何定位慢调用和失败点?
每一项单独看都是一个工程项目,加起来可能比写 Agent 本身的代码还多。AgentRun 要解决的不是“发明多 Agent”,而是让多 Agent 从实验室协作变成可上线、可管理、可审计的生产系统。

二、为什么选择 A2A:用开放协议定义“怎么发现、怎么通信”

多 Agent 协作最怕被平台私有协议锁死:每接一个 Agent,就要重新适配一套能力描述、鉴权方式和调用协议。Agent 一多,系统很快变成烟囱。 A2A(Agent-to-Agent)是 Google 主导的开放协议,不绑定任何平台。这意味着你自建的 Agent、第三方的 Agent、不同云厂商的 Agent,只要遵循 A2A,就能基于同一套标准互相发现和通信。 它的价值,在于为 Agent 之间的互联提供了一套开放、统一的基础约定:
  • 自描述:通过 AgentCard 描述 Agent 是谁、能做什么、怎么访问;
  • 可发现:调用方可以基于标准入口获取 AgentCard,而不是依赖人工配置;
  • 可互通:不同团队、不同平台、不同运行环境的 Agent,只要遵循协议,就能被统一接入;
  • 可演进:协议层定义连接方式,平台层可以继续补齐注册、权限、治理、观测等生产能力。
所以,AgentRun 选择 A2A,不是把 A2A 包装成自己的私有能力,而是基于开放协议承接生态互通,再在协议之上补齐企业落地所需的管理面。

三、A2A 发现机制原理

AgentCard:智能体的自我介绍

A2A 协议通过 AgentCard 让每个智能体对外自描述能力与接入方式。AgentCard 是一份标准 JSON 文档,描述了:
  • 是谁:Agent 的名称、描述、版本、提供方;
  • 能做什么:技能列表(Skills),每个技能有 ID、名称、描述和示例问法;
  • 怎么访问:服务地址(URL)、支持的传输协议(如 JSON-RPC / gRPC);
  • 有什么限制:认证方式、是否支持流式响应等。
按照 A2A 标准,AgentCard 默认托管在 <font style="color:rgb(51, 51, 51);background-color:rgba(27, 31, 35, 0.05);">/.well-known/agent-card.json</font> 路径下。客户端只需知道 Agent 的 Base URL,就能拿到这份自描述文档,进而决定如何与它通信。

服务发现:谁在这个网络里?

有了 AgentCard,还缺一个关键问题的答案: 我怎么知道有哪些 Agent 可以调用?

A2A 协议本身不强制定义中心化注册表,实际项目中通常需要一个「发现层」来管理 Agent 的注册和查询。发现层接受查询请求,返回可用 Agent 的 AgentCard URL,调用方再逐一拉取 AgentCard 完成能力感知。 这也是 AgentRun 发挥价值的地方:协议定义“怎么描述、怎么连接”,平台负责“怎么注册、怎么发现、怎么隔离、怎么治理”。

四、AgentRun 的多 Agent 管理:注册、发现与隔离

AgentRun 在 A2A 协议基础上,提供了一套生产级的多 Agent 管理体系,核心围绕三个概念:

工作空间(Workspace):逻辑隔离的 Agent 集合

工作空间是 AgentRun 中组织 Agent 的基本单位,类似于一个「项目空间」或「命名空间」。不同业务域、不同团队的 Agent 可以分属不同工作空间,互相隔离,权限独立管理。 一个 Agent Runtime 归属于一个工作空间后,工作空间就成为它对外可被发现的范围边界。

发现端点(Discovery Endpoint):按环境隔离的发现入口

一个工作空间内可以配置多个发现端点,典型用法是按部署环境区分:
工作空间: my-ai-platform
  ├── 发现端点 default    → 面向内部调试,包含所有 Agent
  └── 发现端点 production → 面向生产流量,只含稳定版 Agent
每个发现端点维护一张映射表,记录「哪个 Agent」对应「哪个访问地址」。同一个 Agent 在不同端点中可以配置不同地址,例如开发地址和生产自定义域名。

平台托管 vs 外部 Agent:统一的发现体验

AgentRun 支持两类 Agent 共存于同一工作空间:
类型 部署方式 注册方式 状态流转
平台托管 Agent AgentRun 负责部署到 FC 通过创建注册 CREATING → READY
外部 Agent 自行部署在任意位置 手动注册到指定空间 直接 READY
两类 Agent 在发现端点中的表现完全一致——调用方拿到的都是标准 <font style="color:rgb(51, 51, 51);background-color:rgba(27, 31, 35, 0.05);">a2aAgentCardUrl</font> ,无需关心 Agent 实际部署在哪里。

凭证安全保护:谁可以发现这些 Agent?

服务发现本身就是敏感信息:暴露工作空间内有哪些 Agent、它们在哪里,可能为攻击者提供侦察入口。AgentRun 在发现端点上内置了凭证验证体系,支持 API Key、HTTP Basic Auth 等方式。 凭证配置与工作空间解耦。更换凭证时,只需在平台重新绑定,无需修改任何 Agent 的代码。

五、实战体验:用“希希咖啡厅”跑通发现链路

本文以「希希咖啡厅」多 Agent 系统作为演示对象。目标不是展开 SDK 细节,而是让你看到一套多 Agent 如何被纳入 AgentRun 的工作空间,并通过统一发现端点暴露为 A2A 可调用资源。

1. 部署模板,准备两个专职 Agent

在 AgentRun 控制台的 Agent 模版 页面一键部署「希希咖啡厅」,平台会自动创建两个专职 Agent:
  • <font style="color:rgb(51, 51, 51);background-color:rgba(27, 31, 35, 0.05);">coffee_agent</font>:负责点单、查看菜单、查询订单;
  • <font style="color:rgb(51, 51, 51);background-color:rgba(27, 31, 35, 0.05);">delivery_agent</font>:负责安排配送和查询配送状态。

image.png

2. 创建工作空间,确定管理边界

新建一个 Workspace,作为这组 Agent 的组织、隔离和发现边界。后续所有服务发现都以工作空间为范围。
image.png


### 3. 注册 Agent,统一托管与外部接入
将平台托管 Agent 或外部 A2A 兼容 Agent 纳入工作空间。注册完成后,调用方看到的都是统一的 <font style="color:rgb(51, 51, 51);background-color:rgba(27, 31, 35, 0.05);">a2aAgentCardUrl</font> ,不需要关心 Agent 实际部署在 AgentRun、客户自建服务还是第三方平台。

4. 配置发现端点,暴露可控的发现入口

在工作空间的「服务发现」中添加端点,配置 Agent 映射和访问凭证。你可以按环境拆分端点,例如 <font style="color:rgb(51, 51, 51);background-color:rgba(27, 31, 35, 0.05);">default</font> 用于调试, <font style="color:rgb(51, 51, 51);background-color:rgba(27, 31, 35, 0.05);">production</font> 只暴露稳定版 Agent。

image.png

image.png

image.png

5. 调用发现端点,拿到 AgentCard 入口

配置完成后,请求工作空间的 discovery API:
curl -s \
  -H 'X-API-Key: <your-api-key>' \
  'https://<uid>.agentrun-data.cn-hangzhou.aliyuncs.com/workspaces/<workspace-name>/discovery/agents?discoveryEndpointName=default'
响应中的 <font style="color:rgb(51, 51, 51);background-color:rgba(27, 31, 35, 0.05);">a2aAgentCardUrl</font> 就是 A2A 客户端连接对应 Agent 的入口。到这里,链路已经跑通: 注册 Agent → 配置发现端点 → 获取 AgentCard URL → 发起 A2A 通信 完整协议字段和 SDK 调用方式可以直接参考官方资料:

六、从发现到调度:超级 Agent 与生产级多 Agent 方案

走通 A2A 发现链路后,多 Agent 系统具备了“怎么发现、怎么通信”的基础。但真正进入业务场景,还会继续遇到一个问题: 很多用户知道有哪些 Agent,却不知道该怎么搭建协作关系、怎么选择调用顺序、怎么把复杂任务拆给合适的 Agent。

这就是 AgentRun 超级 Agent 要解决的问题。它不是放在 A2A 之前的孤立功能,而是在 A2A 发现和工作空间管理之上的调度入口:
  • A2A 定义 Agent 如何自描述、如何被发现、如何通信;
  • 工作空间定义 Agent 如何被组织、隔离、授权、治理;
  • 超级 Agent 进一步承担 Orchestrator 角色,把用户意图拆成子任务,并动态调用合适的专职 Agent。
用户:“帮我点一杯拿铁,送到公司”
       │
       ▼
┌─────────────────────┐
│  超级 Agent (主)     │  ← 理解意图,拆解为子任务
│  Orchestrator       │
└──────┬──────┬───────┘
       │      │
       ▼      ▼
┌──────────┐ ┌──────────┐
│coffee_   │ │delivery_ │  ← 各自执行专属任务
│agent     │ │agent     │
└──────────┘ └──────────┘
       │           │
       ▼           ▼
   创建订单     安排配送
相比业界常见的“框架式多 Agent Demo”,AgentRun 更关注生产落地中的管理面:
  • 开放互通:基于 A2A 接入平台托管 Agent 和外部 Agent,避免被私有协议锁死;
  • 统一治理:通过工作空间、发现端点和凭证体系管理 Agent 的可见范围与访问边界;
  • 服务端编排:超级 Agent 在服务端完成调度,调用方只需要面向一个入口发起请求;
  • 生产可观测:跨 Agent 调用链路可追踪、可审计,便于定位复杂协作中的失败点;
  • 渐进演进:先用 A2A 和工作空间管起来,再用超级 Agent 把协作调度做起来。
换句话说,AgentRun 不是只提供一个多 Agent 编程框架,而是提供一套从开放协议、注册发现、权限隔离到调度编排的生产级方案。后续篇章中,我们会继续展开超级 Agent 如何完成任务拆解、子 Agent 选择和服务端编排。

七、小结

AgentRun 让多 Agent 协作像调一个 API 一样简单——用 A2A 这个开放标准打破智能体孤岛,用工作空间实现生产级管理,并用超级 Agent 把协作真正组织起来。 如果你已经有自建 Agent、第三方 Agent 或不同云上的 Agent,只要它们遵循 A2A,就可以被纳入同一套发现和通信体系;如果你还没有调度体系,AgentRun 也提供了从注册发现、权限隔离到服务端编排的生产级路径。

附录:相关链接

相关文章
|
4天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
5天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
8637 37
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
5天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
654 4
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
5天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
659 5
|
5天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
727 148
|
5天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
5天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
566 2
|
5天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
1961 10
|
5天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
1614 2
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
5天前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
773 1