从单兵作战到团队协作:AgentRun 的多 Agent 生产级协作方案

简介: AgentRun提供多 Agent 生产级协作方案,解决多 Agent 发现、调用、鉴权、编排与治理难题;通过工作空间实现环境隔离与统一管理,让开发者专注 Agent 能力本身,真正实现“协作如调 API 一般简单”。

作者:丛霄、悠逸


单个 Agent 再强,也只是一个人在战斗。真正的生产力倍增,来自多个专职 Agent 的协同——而 AgentRun 让这件事变得像调一个 API 一样简单。


多 Agent 并不是新概念,难点也不在于把任务拆给几个 Agent。真正卡住生产落地的,是拆完之后怎么让它们稳定地互相发现、互相调用、互相信任,并且在团队、环境、权限和链路追踪上可管理。


AgentRun 的定位正是把这部分工程复杂度收敛到平台:用 A2A 开放协议打破智能体孤岛,用工作空间提供生产级管理,让开发者把精力放回 Agent 能力本身。

从单 Agent 到多 Agent:为什么协作难落地

单个 Agent 再强大,面对跨领域的复杂任务,终究会遇到能力边界。一个「点咖啡」的 Agent 不应该知道怎么「安排配送」,一个「写代码」的 Agent 不应该知道怎么「审批流程」。更合理的方式,是让不同 Agent 各司其职,再通过协作机制互相发现、互相调用。


问题在于,自建一套多 Agent 系统并不只是“多写几个 Agent”。你还需要自己解决一整套平台工程问题:


  • 注册中心: 哪些 Agent 在线?属于哪个环境?当前地址是什么?
  • 服务发现: 调用方如何找到合适的 Agent?如何读取它的能力描述?
  • 跨 Agent 鉴权: 谁可以发现谁、调用谁?凭证如何轮转?
  • 调度编排: 复杂任务如何拆解、分发、重试、聚合结果?
  • 环境隔离: 开发、测试、生产的 Agent 如何避免互相串用?
  • 链路追踪: 一次用户请求跨多个 Agent 后,如何定位慢调用和失败点?


每一项单独看都是一个工程项目,加起来可能比写 Agent 本身的代码还多。AgentRun 要解决的不是“发明多 Agent”,而是让多 Agent 从实验室协作变成可上线、可管理、可审计的生产系统。

为什么选择 A2A:用开放协议定义“怎么发现、怎么通信”

多 Agent 协作最怕被平台私有协议锁死:每接一个 Agent,就要重新适配一套能力描述、鉴权方式和调用协议。Agent 一多,系统很快变成烟囱。


A2A(Agent-to-Agent)是 Google 主导的开放协议,不绑定任何平台。这意味着你自建的 Agent、第三方的 Agent、不同云厂商的 Agent,只要遵循 A2A,就能基于同一套标准互相发现和通信。


它的价值,在于为 Agent 之间的互联提供了一套开放、统一的基础约定:


  • 自描述: 通过 AgentCard 描述 Agent 是谁、能做什么、怎么访问;
  • 可发现: 调用方可以基于标准入口获取 AgentCard,而不是依赖人工配置;
  • 可互通: 不同团队、不同平台、不同运行环境的 Agent,只要遵循协议,就能被统一接入;
  • 可演进: 协议层定义连接方式,平台层可以继续补齐注册、权限、治理、观测等生产能力。


所以,AgentRun 选择 A2A,不是把 A2A 包装成自己的私有能力,而是基于开放协议承接生态互通,再在协议之上补齐企业落地所需的管理面。

A2A 发现机制原理

AgentCard:智能体的自我介绍

A2A 协议通过 AgentCard 让每个智能体对外自描述能力与接入方式。AgentCard 是一份标准 JSON 文档,描述了:


  • 是谁: Agent 的名称、描述、版本、提供方;
  • 能做什么: 技能列表(Skills),每个技能有 ID、名称、描述和示例问法;
  • 怎么访问: 服务地址(URL)、支持的传输协议(如 JSON-RPC / gRPC);
  • 有什么限制: 认证方式、是否支持流式响应等。


按照 A2A 标准,AgentCard 默认托管在 /.well-known/agent-card.json 路径下。客户端只需知道 Agent 的 Base URL,就能拿到这份自描述文档,进而决定如何与它通信。

服务发现:谁在这个网络里?

有了 AgentCard,还缺一个关键问题的答案:我怎么知道有哪些 Agent 可以调用?


A2A 协议本身不强制定义中心化注册表,实际项目中通常需要一个「发现层」来管理 Agent 的注册和查询。发现层接受查询请求,返回可用 Agent 的 AgentCard URL,调用方再逐一拉取 AgentCard 完成能力感知。


这也是 AgentRun 发挥价值的地方:协议定义“怎么描述、怎么连接”,平台负责“怎么注册、怎么发现、怎么隔离、怎么治理”。

AgentRun 的多 Agent 管理:注册、发现与隔离

AgentRun 在 A2A 协议基础上,提供了一套生产级的多 Agent 管理体系,核心围绕三个概念:

工作空间(Workspace):逻辑隔离的 Agent 集合**

工作空间是 AgentRun 中组织 Agent 的基本单位,类似于一个「项目空间」或「命名空间」。不同业务域、不同团队的 Agent 可以分属不同工作空间,互相隔离,权限独立管理。


一个 Agent Runtime 归属于一个工作空间后,工作空间就成为它对外可被发现的范围边界。

发现端点(Discovery Endpoint):按环境隔离的发现入口**

一个工作空间内可以配置多个发现端点,典型用法是按部署环境区分:

工作空间: my-ai-platform
  ├── 发现端点 default    → 面向内部调试,包含所有 Agent  
  └── 发现端点 production → 面向生产流量,只含稳定版 Agent

每个发现端点维护一张映射表,记录「哪个 Agent」对应「哪个访问地址」。同一个 Agent 在不同端点中可以配置不同地址,例如开发地址和生产自定义域名。

平台托管 vs 外部 Agent:统一的发现体验

AgentRun 支持两类 Agent 共存于同一工作空间:

类型 部署方式 注册方式 状态流转
平台托管 Agent AgentRun 负责部署到 FC 通过创建注册 CREATING → READY
外部 Agent 自行部署在任意位置 手动注册到指定空间 直接 READY

两类 Agent 在发现端点中的表现完全一致——调用方拿到的都是标准 a2aAgentCardUrl,无需关心 Agent 实际部署在哪里。

凭证安全保护:谁可以发现这些 Agent?

服务发现本身就是敏感信息:暴露工作空间内有哪些 Agent、它们在哪里,可能为攻击者提供侦察入口。AgentRun 在发现端点上内置了凭证验证体系,支持 API Key、HTTP Basic Auth 等方式。


凭证配置与工作空间解耦。更换凭证时,只需在平台重新绑定,无需修改任何 Agent 的代码。

实战体验:用“希希咖啡厅”跑通发现链路

本文以「希希咖啡厅」多 Agent 系统作为演示对象。目标不是展开 SDK 细节,而是让你看到一套多 Agent 如何被纳入 AgentRun 的工作空间,并通过统一发现端点暴露为 A2A 可调用资源。

1. 部署模板,准备两个专职 Agent

在 AgentRun 控制台的 Agent 模版页面一键部署「希希咖啡厅」,平台会自动创建两个专职 Agent:


  • coffee_agent:负责点单、查看菜单、查询订单;
  • delivery_agent:负责安排配送和查询配送状态。

2. 创建工作空间,确定管理边界

新建一个 Workspace,作为这组 Agent 的组织、隔离和发现边界。后续所有服务发现都以工作空间为范围。

3. 注册 Agent,统一托管与外部接入

将平台托管 Agent 或外部 A2A 兼容 Agent 纳入工作空间。注册完成后,调用方看到的都是统一的 a2aAgentCardUrl,不需要关心 Agent 实际部署在 AgentRun、客户自建服务还是第三方平台。

4. 配置发现端点,暴露可控的发现入口

在工作空间的「服务发现」中添加端点,配置 Agent 映射和访问凭证。你可以按环境拆分端点,例如 default 用于调试,production 只暴露稳定版 Agent。

5. 调用发现端点,拿到 AgentCard 入口

配置完成后,请求工作空间的 discovery API:

curl -s \
  -H 'X-API-Key: <your-api-key>' \
  'https://<uid>.agentrun-data.cn-hangzhou.aliyuncs.com/workspaces/<workspace-name>/discovery/agents?discoveryEndpointName=default'

响应中的 a2aAgentCardUrl 就是 A2A 客户端连接对应 Agent 的入口。到这里,链路已经跑通:注册 Agent → 配置发现端点 → 获取 AgentCard URL → 发起 A2A 通信

完整协议字段和 SDK 调用方式可以直接参考官方资料:


从发现到调度:超级 Agent 与生产级多 Agent 方案

走通 A2A 发现链路后,多 Agent 系统具备了“怎么发现、怎么通信”的基础。但真正进入业务场景,还会继续遇到一个问题:很多用户知道有哪些 Agent,却不知道该怎么搭建协作关系、怎么选择调用顺序、怎么把复杂任务拆给合适的 Agent。


这就是 AgentRun 超级 Agent 要解决的问题。它不是放在 A2A 之前的孤立功能,而是在 A2A 发现和工作空间管理之上的调度入口:


  • A2A 定义 Agent 如何自描述、如何被发现、如何通信;
  • 工作空间定义 Agent 如何被组织、隔离、授权、治理;
  • 超级 Agent 进一步承担 Orchestrator 角色,把用户意图拆成子任务,并动态调用合适的专职 Agent。
用户:“帮我点一杯拿铁,送到公司”
┌─────────────────────┐
│  超级 Agent (主)     │  ← 理解意图,拆解为子任务
│  Orchestrator       │
└──────┬──────┬───────┘
       │      │
       ▼      ▼
┌──────────┐ ┌──────────┐
│coffee_   │ │delivery_ │  ← 各自执行专属任务
│agent     │ │agent     │
└──────────┘ └──────────┘
       │           │
       ▼           ▼
   创建订单     安排配送

相比业界常见的“框架式多 Agent Demo”,AgentRun 更关注生产落地中的管理面:


  • 开放互通: 基于 A2A 接入平台托管 Agent 和外部 Agent,避免被私有协议锁死;
  • 统一治理: 通过工作空间、发现端点和凭证体系管理 Agent 的可见范围与访问边界;
  • 服务端编排: 超级 Agent 在服务端完成调度,调用方只需要面向一个入口发起请求;
  • 生产可观测: 跨 Agent 调用链路可追踪、可审计,便于定位复杂协作中的失败点;
  • 渐进演进: 先用 A2A 和工作空间管起来,再用超级 Agent 把协作调度做起来。


换句话说,AgentRun 不是只提供一个多 Agent 编程框架,而是提供一套从开放协议、注册发现、权限隔离到调度编排的生产级方案。后续篇章中,我们会继续展开超级 Agent 如何完成任务拆解、子 Agent 选择和服务端编排。

小结

AgentRun 让多 Agent 协作像调一个 API 一样简单——用 A2A 这个开放标准打破智能体孤岛,用工作空间实现生产级管理,并用超级 Agent 把协作真正组织起来。


如果你已经有自建 Agent、第三方 Agent 或不同云上的 Agent,只要它们遵循 A2A,就可以被纳入同一套发现和通信体系;如果你还没有调度体系,AgentRun 也提供了从注册发现、权限隔离到服务端编排的生产级路径。


相关链接:

[1] AgentRun 控制台

https://functionai.console.aliyun.com/

[2] A2A Protocol Specification

https://a2a-protocol.org/latest/specification/

[3] a2a-go SDK

https://github.com/a2aproject/a2a-go

[4] AgentRun Python SDK

https://github.com/Serverless-Devs/agentrun-sdk-python

[5] 产品文档:阿里云 AgentRun

https://help.aliyun.com/zh/functioncompute/fc/what-is-agentrun

[6] AgentRun 客户群群号:134570017218,如有技术问题或合作意向,欢迎联系我们。

相关文章
|
6天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
6天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
712 6
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
6天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
8738 37
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
6天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
698 5
|
6天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
6天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
746 149
|
6天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
586 2
|
6天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
1788 3
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
6天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
1973 10
|
6天前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
804 1