一文讲解与Agent前端发展相关的几个阶段和协议

简介: 本文梳理了Agent前端协议从“胶水代码”到标准化的演进历程。解析了MCP、MCPApps、A2A、AG-UI及A2UI在能力、协作、通信与呈现架构中的核心作用。通过深度集成,前端正实现AI能力的富交互呈现,推动人机交互走向“可见、可控、可信”。

目前的 Agent 能力大家认识较多的一般可见于后端的 Agent 协议,比如 MCP ,A2A 等等,大部分的 Agent 框架对这些协议做了很好的封装,可是对于广大的前端程序员而言,前端的开发和工程化手段貌似没有太大的变化,其实不然,目前的 Agent 协议已经是全面发展,不再仅仅局限后端一个领域。我们写这篇文章就是希望能刷新大家的一些固有的认知:Agent 不止后端程序员的专享。

在 ChatGPT 刚刚兴起的时候,我的一个固有认知就是 LLM 对于前端同学而言,只需要一个对话框就够了,所以把更多的精力和工程化的手段放到了 Prompt,Workflow 等事情上。

后面随着 MCP 的兴起,再加上 Google 发布 A2A 等行业标准协议的确立,才让我有了对于前端一些更多的思考:难道前端就真的不需要参与其中?现在看起来,前端不仅需要参与,其实它一直在演进,下面的表格我们梳理了一下大致的脉络。

阶段

时间

特征

事件

早期

2023 年底

  • 工具连接重复造轮

  • 企业自研中间件泛滥

  • “M×N集成地狱”凸显

  • 大模型能力溢出,传统GUI无法承载

  • 开发者70%时间消耗于胶水代码

前期

2024 年

  • 首个通用开放标准出现

  • 2024.02:MCP开源(Anthropic)— “AI世界的USB-C",11 月发布规范第一版

中期

2025 年

  • 继续构建协议矩阵

  • 形成“能力-协作-通信-呈现”四层架构

  • 2025.03:A2A发布(Google)— Agent协作语言,引入Agent Card能力发现

  • 2025.05:AG-UI发布(CopilotKit)— 人机事件通信标准化

  • 2025.09:A2UI开源(Google)— 声明式UI生成+安全沙箱,与AG-UI闭环

现在

2026 年

  • 协议深度协同集成

  • 2026.01:MCP Apps 第一个稳定版本发布


01

早期,全行业卖胶水



2023年底,大模型能力呈现爆发式增长,但传统GUI(Graph User Interface)无法承载大模型具备的推理、规划、记忆等复杂能力,静态界面无法做出展示用户面临“功能可见性低”、“控制感缺失”等问题。

Function calling 与 Tool Use 概念相继出现,开发者面临"M×N集成地狱":M个Agent × N个工具 = M×N次重复开发,开发者大部分时间消耗于"胶水代码",而非创造核心价值。

本质问题是 AI Agent 已能做“智能决策”,但技术生态不成熟,前端仍停留在传统 GUI 。


02

前期,开始有人提标准



2024 年初提出 MCP(Model Context Protocol) 概念并在 2024 年 11 月确定了 MCP 规范的第一个版本,这标志首个工具连接的开放通用标准 MCP 出现解决“工具连接”混乱这一最基础、最普遍的痛点推动业界从“自研”向“标准化”转变,加速生态建设。

MCP

MCP 被喻为“ AI应用的USB-C接口”,支持安全高效地连接AI系统与企业数据和工具,为LLM与外部工具和数据源无缝集成的提供了开放标准。

它的核心作用:

  • 标准化上下文接入:统一的协议规范让 LLM 模型能够标准化地访问各种数据源和工具。从文件系统到数据库,从API到本地服务,一套协议解决所有上下文集成需求。实现“即插即用”的工具集成,避免M×N重复开发。
  • 安全可控架构基于宿主应用的安全代理模式,确保AI对数据的访问完全可控。支持细粒度权限管理和完整的操作审计,满足企业级安全要求。
  • 轻量高效协议采用JSON-RPC作为通信基础,支持多种传输层实现。协议设计简洁高效,易于理解和实现,同时保证了良好的扩展性和兼容性。

它的架构:

  • MCP Host:用于协调和管理一个或多个 MCP 客户端的 AI 应用程序.
  • MCP Client:一个维护与 MCP 服务器连接并从 MCP 服务器获取上下文以供 MCP 主机使用的组件。
  • MCP Server:一个为 MCP 客户端提供上下文信息的程序。

image.png


03

中期,发现了更多可做的事情



2025 年随着 Agent 研发工程方法的不断深入与演进,大家认识到在工程过程中还存在很多“摩擦点”。“能力-协作-通信-呈现”四层架构来分析,各层需要协同工作,但不同层间还缺少对应协议。这需要一些新的协议/框架来补充生态,如:Agent协作、动态UI生成。

A2A

2025年 3 月 google 发布了A2A(Agent2Agent Protocol),它的目标是实现 Agent 与 Agent 间的无缝通信和协作。

它的核心作用:

  • 实现跨厂商、跨框架智能体的标准化协作
  • 解决“各说各话”的信息孤岛问题

它的关键技术:

  • Agent Card:JSON格式描述智能体能力
  • 任务管理:支持任务分解、状态同步、回调机制
  • 合作机制:允许交换上下文、回复、工件或用户指令

A2A 与 MCP 的集成协作方式如图:

AG-UI

2025 年5月CopilotKit发布了AG-UI(Agent-User Interaction Protocol),它的目标是成为面向用户的应用程序与 Agent 之间的通用双向连接。

它的核心作用:

  • 标准化智能体与前端界面之间的实时事件流传输
  • 解决“每个Agent重写前端逻辑”的痛点

它的设计原则:

  • 事件驱动通信(Event-driven)
  • 支持SSE、WebSocket等多种传输方式
  • 16种标准化事件类型(如message, tool_call, state_update

它的架构:

  • Application:面向用户的应用(例如聊天或任何人工智能应用)。
  • AG-UI Client:通用通信客户端HttpAgent或用于连接现有协议的专用客户端。
  • AI Agent:后端 AI 代理,用于处理请求并生成流式响应。
  • Secure Proxy:提供额外功能并充当安全代理的后端服务。

image.png

它与 MCP、A2A 集成协作方式如图:

A2UI

2025年 9 月 Google开源了A2UI(Agent to UI Protocol),是一种用于 Agent 驱动的声明式 UI 协议。它的目标是 Agent 能够生成丰富的交互式用户界面,这些界面可以在 Web、移动设备和桌面设备上原生渲染,而无需执行任意代码。

它的核心价值:

  • 安全性:声明式数据,而非代码。代理从客户端的可信目录中请求组件。不存在代码执行风险。
  • 原生体验:不使用 iframe。客户端使用自己的 UI 框架进行渲染。继承应用程序的样式、可访问性和性能。
  • 可移植性:一个代理响应即可在任何地方使用。相同的 JSON 可在 Web(Lit/Angular/React)、移动设备(Flutter/SwiftUI/Jetpack Compose)和桌面设备上渲染。

它的设计原则:

  • 兼容LLM:扁平化的组件列表,带有ID引用。易于增量生成、纠错和流式传输。
  • 与框架无关:代理发送抽象组件树。客户端映射到原生组件(web/移动/桌面)。
  • 关注点分离:三层架构——用户界面结构、应用程序状态、客户端渲染。支持数据绑定、响应式更新和清晰的架构。

它与 A2A、AG-UI、MCP Apps 之间集成协作关系是:

  • A2UI 与 A2A:可以通过 A2A 直接向客户端前端发送 A2UI 作为数据格式的消息。
  • A2UI 与 AG-UI:可以通过 AG UI 直接向客户端前端发送 A2UI 作为数据格式的消息。
  • A2UI 与 MCP Apps:A2UI 采用“原生优先”的方法,这与 MCP Apps 的资源获取方式不同。A2UI Agent 不会像 MCP Apps 那样获取不透明的有效负载并在沙盒中显示,而是发送原生组件的蓝图。这使得 UI 能够完美地继承宿主应用的样式和辅助功能。


04

现在,前后端开始集成融合



从 MCP 到 MCP Apps 协议,Agent 有更多的互操作性,可以看到 Agent 生态系统协议在不断扩展,且是在原有协议上进行原生的深度集成融合。

MCP Apps

2025 年 11 月正式发布了 MCP Apps 扩展提案(SEP-1865),为 MCP 引入标准化的交互式 UI,然后在 2026 年 1 月发布了第一个稳定版本。这一扩展由 OpenAI、Anthropic、MCP-UI 核心维护者联合主导,标志着 MCP 从纯文本与结构化数据交互,迈向支持富交互体验的 Agentic App 的关键一步。

MCP Apps 让 MCP 工具能够返回富交互式界面,而不仅仅是纯文本,构建可在 MCP 主机(例如 Claude Desktop)中渲染的交互式 UI 应用程序。当工具声明一个 UI 资源时,宿主(Host)会在沙盒化的 iframe 中渲染它,用户可以直接在对话中与之交互。

MCP Apps 的架构依赖于两个关键的 MCP 原语:

  • 带有 UI 元数据的工具:工具包含 _meta.ui.resourceUri 字段,指向 UI 资源
  • UI 资源:通过 ui:// scheme 提供的服务器端资源,包含打包的 HTML/JavaScript



// 带有 UI 元数据的工具
{
  name: "visualize_data",
  description: "将数据可视化为交互式图表",
  inputSchema: { /* ... */ },
  _meta: {
    ui: {
      resourceUri: "ui://charts/interactive"
    }
  }
}


宿主获取资源,在沙盒化的 iframe 中渲染,并通过 postMessage 上的 JSON-RPC 启用双向通信。

它的架构:

  • MCP Server:一个标准的 MCP 服务器,用于声明工具和 UI 资源。该服务器定义了 UI 的外观(HTML)以及它公开的工具。
  • MCP Host:连接到 MCP Server、将视图嵌入 iframe 并代理它们之间通信的聊天客户端(例如 Claude Desktop)。
  • View:视图,运行在沙盒化 iframe 中的用户界面。它从主机接收工具数据,并可以调用服务器工具或向聊天室发送消息。

image.png

MCP Apps 目前已在以下客户端支持:

  • Claude Desktop
  • Goose
  • ...


05

总结


随着技术生态成熟,应用场景落地,Agent 治理挑战也更加明显,其本质是一场从“技术孤岛”到“用户体验”的改变。这些协议并非孤立标准而是相互补充、融合,一起构建更完善的 AI Agent 生态如图

  • MCP(能力层):将数据库、API、硬件等原子能力封装为标准接口
  • A2A(协作层):实现跨框架Agent任务分解、状态同步与能力发现
  • AG-UI(通信层):以事件流承载意图、确认与状态,确保人机对话透明可溯
  • A2UI / MCP Apps(呈现层):将AI意图转化为安全、合规、情境适配的动态界面

与 Agent 技术本身一样,前端的协议和技术也必然会一路往前继续狂奔,最终实现“可见、可控、可信”的人机交互。随着 Agent 这一技术的普及和交互方式逐步深入人心,2026 年也会迎来更大的变革,让我们拭目以待吧!

参考文章与链接:

[1] https://modelcontextprotocol.io/docs/getting-started/intro

[2] https://a2a-protocol.org/

[3] https://docs.ag-ui.com/introduction

[4] https://a2ui.org/

[5] https://modelcontextprotocol.io/docs/extensions/apps

[6] https://modelcontextprotocol.github.io/ext-apps/api/

[7] https://a2ui.org/introduction/agent-ui-ecosystem/

[8] https://docs.ag-ui.com/agentic-protocols

[9] https://a2a-protocol.org/latest/#how-does-a2a-work-with-mcp


目录
相关文章
|
28天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
37393 150
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
10天前
|
人工智能 自然语言处理 监控
OpenClaw skills重构量化交易逻辑:部署+AI全自动炒股指南(2026终极版)
2026年,AI Agent领域最震撼的突破来自OpenClaw(原Clawdbot)——这个能自主规划、执行任务的智能体,用50美元启动资金创造了48小时滚雪球至2980美元的奇迹,收益率高达5860%。其核心逻辑堪称教科书级:每10分钟扫描Polymarket近千个预测市场,借助Claude API深度推理,交叉验证NOAA天气数据、体育伤病报告、加密货币链上情绪等多维度信息,捕捉8%以上的定价偏差,再通过凯利准则将单仓位严格控制在总资金6%以内,实现低风险高频套利。
4639 34
|
6天前
|
存储 人工智能 负载均衡
阿里云OpenClaw多Agent实战宝典:从极速部署到AI团队搭建,一个人=一支高效军团
在AI自动化时代,单一Agent的“全能模式”早已无法满足复杂任务需求——记忆臃肿导致响应迟缓、上下文污染引发逻辑冲突、无关信息加载造成Token浪费,这些痛点让OpenClaw的潜力大打折扣。而多Agent架构的出现,彻底改变了这一现状:通过“单Gateway+多分身”模式,让一个Bot在不同场景下切换独立“大脑”,如同组建一支分工明确的AI团队,实现创意、写作、编码、数据分析等任务的高效协同。
1278 22
|
23天前
|
人工智能 安全 机器人
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI助手,支持钉钉、飞书等多平台接入。本教程手把手指导Linux下部署与钉钉机器人对接,涵盖环境配置、模型选择(如Qwen)、权限设置及调试,助你快速打造私有、安全、高权限的专属AI助理。(239字)
8385 24
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
|
22天前
|
人工智能 机器人 Linux
OpenClaw(Clawdbot、Moltbot)汉化版部署教程指南(零门槛)
OpenClaw作为2026年GitHub上增长最快的开源项目之一,一周内Stars从7800飙升至12万+,其核心优势在于打破传统聊天机器人的局限,能真正执行读写文件、运行脚本、浏览器自动化等实操任务。但原版全英文界面对中文用户存在上手门槛,汉化版通过覆盖命令行(CLI)与网页控制台(Dashboard)核心模块,解决了语言障碍,同时保持与官方版本的实时同步,确保新功能最快1小时内可用。本文将详细拆解汉化版OpenClaw的搭建流程,涵盖本地安装、Docker部署、服务器远程访问等场景,同时提供环境适配、问题排查与国内应用集成方案,助力中文用户高效搭建专属AI助手。
5526 12
|
5天前
|
人工智能 JavaScript Linux
别再花钱买云服务器了!OpenClaw 本地部署保姆级教程,10分钟拥有私人AI助理(附阿里云简单部署流程)
2026年,AI私人助理已从“高端配置”变成“日常刚需”,而OpenClaw(原Clawdbot,曾用名Moltbot)作为开源界的“黑马”,凭借自然语言驱动、多技能扩展、零门槛上手的核心优势,成为无数人打造私人AI助理的首选——它无需复杂代码基础,无需高价云服务器,只要你有一台普通电脑(Windows、Mac、Linux均可),跟着步骤操作,10分钟就能完成本地部署,同时也支持阿里云简单部署,兼顾“零成本本地使用”与“云端稳定托管”双重需求,彻底打破“AI助理必花钱”的误区。
1185 5
|
8天前
|
人工智能 JavaScript API
Windows系统OpenClaw保姆级部署指南:本地+云端双方案,零技术基础也能玩转AI助手
在AI办公自动化全面普及的2026年,OpenClaw(原Clawdbot、Moltbot)凭借“自然语言指令操控、多任务自动化执行、多工具无缝集成”的核心优势,成为个人与轻量办公群体打造专属AI助手的首选。它不仅能通过聊天互动响应需求,更具备“动手”和“跑腿”的硬核能力——“手”可读写本地文件、执行代码、操控命令行,“脚”能联网搜索、访问网页并分析内容,“大脑”则可灵活接入Qwen、OpenAI等云端API,或利用本地GPU运行模型,真正实现“聊天框里办大事”。
1123 6