一文讲解与Agent前端发展相关的几个阶段和协议

简介: 本文梳理了Agent前端协议从“胶水代码”到标准化的演进历程。解析了MCP、MCPApps、A2A、AG-UI及A2UI在能力、协作、通信与呈现架构中的核心作用。通过深度集成,前端正实现AI能力的富交互呈现,推动人机交互走向“可见、可控、可信”。

目前的 Agent 能力大家认识较多的一般可见于后端的 Agent 协议,比如 MCP ,A2A 等等,大部分的 Agent 框架对这些协议做了很好的封装,可是对于广大的前端程序员而言,前端的开发和工程化手段貌似没有太大的变化,其实不然,目前的 Agent 协议已经是全面发展,不再仅仅局限后端一个领域。我们写这篇文章就是希望能刷新大家的一些固有的认知:Agent 不止后端程序员的专享。

在 ChatGPT 刚刚兴起的时候,我的一个固有认知就是 LLM 对于前端同学而言,只需要一个对话框就够了,所以把更多的精力和工程化的手段放到了 Prompt,Workflow 等事情上。

后面随着 MCP 的兴起,再加上 Google 发布 A2A 等行业标准协议的确立,才让我有了对于前端一些更多的思考:难道前端就真的不需要参与其中?现在看起来,前端不仅需要参与,其实它一直在演进,下面的表格我们梳理了一下大致的脉络。

阶段

时间

特征

事件

早期

2023 年底

  • 工具连接重复造轮

  • 企业自研中间件泛滥

  • “M×N集成地狱”凸显

  • 大模型能力溢出,传统GUI无法承载

  • 开发者70%时间消耗于胶水代码

前期

2024 年

  • 首个通用开放标准出现

  • 2024.02:MCP开源(Anthropic)— “AI世界的USB-C",11 月发布规范第一版

中期

2025 年

  • 继续构建协议矩阵

  • 形成“能力-协作-通信-呈现”四层架构

  • 2025.03:A2A发布(Google)— Agent协作语言,引入Agent Card能力发现

  • 2025.05:AG-UI发布(CopilotKit)— 人机事件通信标准化

  • 2025.09:A2UI开源(Google)— 声明式UI生成+安全沙箱,与AG-UI闭环

现在

2026 年

  • 协议深度协同集成

  • 2026.01:MCP Apps 第一个稳定版本发布


01

早期,全行业卖胶水



2023年底,大模型能力呈现爆发式增长,但传统GUI(Graph User Interface)无法承载大模型具备的推理、规划、记忆等复杂能力,静态界面无法做出展示用户面临“功能可见性低”、“控制感缺失”等问题。

Function calling 与 Tool Use 概念相继出现,开发者面临"M×N集成地狱":M个Agent × N个工具 = M×N次重复开发,开发者大部分时间消耗于"胶水代码",而非创造核心价值。

本质问题是 AI Agent 已能做“智能决策”,但技术生态不成熟,前端仍停留在传统 GUI 。


02

前期,开始有人提标准



2024 年初提出 MCP(Model Context Protocol) 概念并在 2024 年 11 月确定了 MCP 规范的第一个版本,这标志首个工具连接的开放通用标准 MCP 出现解决“工具连接”混乱这一最基础、最普遍的痛点推动业界从“自研”向“标准化”转变,加速生态建设。

MCP

MCP 被喻为“ AI应用的USB-C接口”,支持安全高效地连接AI系统与企业数据和工具,为LLM与外部工具和数据源无缝集成的提供了开放标准。

它的核心作用:

  • 标准化上下文接入:统一的协议规范让 LLM 模型能够标准化地访问各种数据源和工具。从文件系统到数据库,从API到本地服务,一套协议解决所有上下文集成需求。实现“即插即用”的工具集成,避免M×N重复开发。
  • 安全可控架构基于宿主应用的安全代理模式,确保AI对数据的访问完全可控。支持细粒度权限管理和完整的操作审计,满足企业级安全要求。
  • 轻量高效协议采用JSON-RPC作为通信基础,支持多种传输层实现。协议设计简洁高效,易于理解和实现,同时保证了良好的扩展性和兼容性。

它的架构:

  • MCP Host:用于协调和管理一个或多个 MCP 客户端的 AI 应用程序.
  • MCP Client:一个维护与 MCP 服务器连接并从 MCP 服务器获取上下文以供 MCP 主机使用的组件。
  • MCP Server:一个为 MCP 客户端提供上下文信息的程序。

image.png


03

中期,发现了更多可做的事情



2025 年随着 Agent 研发工程方法的不断深入与演进,大家认识到在工程过程中还存在很多“摩擦点”。“能力-协作-通信-呈现”四层架构来分析,各层需要协同工作,但不同层间还缺少对应协议。这需要一些新的协议/框架来补充生态,如:Agent协作、动态UI生成。

A2A

2025年 3 月 google 发布了A2A(Agent2Agent Protocol),它的目标是实现 Agent 与 Agent 间的无缝通信和协作。

它的核心作用:

  • 实现跨厂商、跨框架智能体的标准化协作
  • 解决“各说各话”的信息孤岛问题

它的关键技术:

  • Agent Card:JSON格式描述智能体能力
  • 任务管理:支持任务分解、状态同步、回调机制
  • 合作机制:允许交换上下文、回复、工件或用户指令

A2A 与 MCP 的集成协作方式如图:

AG-UI

2025 年5月CopilotKit发布了AG-UI(Agent-User Interaction Protocol),它的目标是成为面向用户的应用程序与 Agent 之间的通用双向连接。

它的核心作用:

  • 标准化智能体与前端界面之间的实时事件流传输
  • 解决“每个Agent重写前端逻辑”的痛点

它的设计原则:

  • 事件驱动通信(Event-driven)
  • 支持SSE、WebSocket等多种传输方式
  • 16种标准化事件类型(如message, tool_call, state_update

它的架构:

  • Application:面向用户的应用(例如聊天或任何人工智能应用)。
  • AG-UI Client:通用通信客户端HttpAgent或用于连接现有协议的专用客户端。
  • AI Agent:后端 AI 代理,用于处理请求并生成流式响应。
  • Secure Proxy:提供额外功能并充当安全代理的后端服务。

image.png

它与 MCP、A2A 集成协作方式如图:

A2UI

2025年 9 月 Google开源了A2UI(Agent to UI Protocol),是一种用于 Agent 驱动的声明式 UI 协议。它的目标是 Agent 能够生成丰富的交互式用户界面,这些界面可以在 Web、移动设备和桌面设备上原生渲染,而无需执行任意代码。

它的核心价值:

  • 安全性:声明式数据,而非代码。代理从客户端的可信目录中请求组件。不存在代码执行风险。
  • 原生体验:不使用 iframe。客户端使用自己的 UI 框架进行渲染。继承应用程序的样式、可访问性和性能。
  • 可移植性:一个代理响应即可在任何地方使用。相同的 JSON 可在 Web(Lit/Angular/React)、移动设备(Flutter/SwiftUI/Jetpack Compose)和桌面设备上渲染。

它的设计原则:

  • 兼容LLM:扁平化的组件列表,带有ID引用。易于增量生成、纠错和流式传输。
  • 与框架无关:代理发送抽象组件树。客户端映射到原生组件(web/移动/桌面)。
  • 关注点分离:三层架构——用户界面结构、应用程序状态、客户端渲染。支持数据绑定、响应式更新和清晰的架构。

它与 A2A、AG-UI、MCP Apps 之间集成协作关系是:

  • A2UI 与 A2A:可以通过 A2A 直接向客户端前端发送 A2UI 作为数据格式的消息。
  • A2UI 与 AG-UI:可以通过 AG UI 直接向客户端前端发送 A2UI 作为数据格式的消息。
  • A2UI 与 MCP Apps:A2UI 采用“原生优先”的方法,这与 MCP Apps 的资源获取方式不同。A2UI Agent 不会像 MCP Apps 那样获取不透明的有效负载并在沙盒中显示,而是发送原生组件的蓝图。这使得 UI 能够完美地继承宿主应用的样式和辅助功能。


04

现在,前后端开始集成融合



从 MCP 到 MCP Apps 协议,Agent 有更多的互操作性,可以看到 Agent 生态系统协议在不断扩展,且是在原有协议上进行原生的深度集成融合。

MCP Apps

2025 年 11 月正式发布了 MCP Apps 扩展提案(SEP-1865),为 MCP 引入标准化的交互式 UI,然后在 2026 年 1 月发布了第一个稳定版本。这一扩展由 OpenAI、Anthropic、MCP-UI 核心维护者联合主导,标志着 MCP 从纯文本与结构化数据交互,迈向支持富交互体验的 Agentic App 的关键一步。

MCP Apps 让 MCP 工具能够返回富交互式界面,而不仅仅是纯文本,构建可在 MCP 主机(例如 Claude Desktop)中渲染的交互式 UI 应用程序。当工具声明一个 UI 资源时,宿主(Host)会在沙盒化的 iframe 中渲染它,用户可以直接在对话中与之交互。

MCP Apps 的架构依赖于两个关键的 MCP 原语:

  • 带有 UI 元数据的工具:工具包含 _meta.ui.resourceUri 字段,指向 UI 资源
  • UI 资源:通过 ui:// scheme 提供的服务器端资源,包含打包的 HTML/JavaScript



// 带有 UI 元数据的工具
{
  name: "visualize_data",
  description: "将数据可视化为交互式图表",
  inputSchema: { /* ... */ },
  _meta: {
    ui: {
      resourceUri: "ui://charts/interactive"
    }
  }
}


宿主获取资源,在沙盒化的 iframe 中渲染,并通过 postMessage 上的 JSON-RPC 启用双向通信。

它的架构:

  • MCP Server:一个标准的 MCP 服务器,用于声明工具和 UI 资源。该服务器定义了 UI 的外观(HTML)以及它公开的工具。
  • MCP Host:连接到 MCP Server、将视图嵌入 iframe 并代理它们之间通信的聊天客户端(例如 Claude Desktop)。
  • View:视图,运行在沙盒化 iframe 中的用户界面。它从主机接收工具数据,并可以调用服务器工具或向聊天室发送消息。

image.png

MCP Apps 目前已在以下客户端支持:

  • Claude Desktop
  • Goose
  • ...


05

总结


随着技术生态成熟,应用场景落地,Agent 治理挑战也更加明显,其本质是一场从“技术孤岛”到“用户体验”的改变。这些协议并非孤立标准而是相互补充、融合,一起构建更完善的 AI Agent 生态如图

  • MCP(能力层):将数据库、API、硬件等原子能力封装为标准接口
  • A2A(协作层):实现跨框架Agent任务分解、状态同步与能力发现
  • AG-UI(通信层):以事件流承载意图、确认与状态,确保人机对话透明可溯
  • A2UI / MCP Apps(呈现层):将AI意图转化为安全、合规、情境适配的动态界面

与 Agent 技术本身一样,前端的协议和技术也必然会一路往前继续狂奔,最终实现“可见、可控、可信”的人机交互。随着 Agent 这一技术的普及和交互方式逐步深入人心,2026 年也会迎来更大的变革,让我们拭目以待吧!

参考文章与链接:

[1] https://modelcontextprotocol.io/docs/getting-started/intro

[2] https://a2a-protocol.org/

[3] https://docs.ag-ui.com/introduction

[4] https://a2ui.org/

[5] https://modelcontextprotocol.io/docs/extensions/apps

[6] https://modelcontextprotocol.github.io/ext-apps/api/

[7] https://a2ui.org/introduction/agent-ui-ecosystem/

[8] https://docs.ag-ui.com/agentic-protocols

[9] https://a2a-protocol.org/latest/#how-does-a2a-work-with-mcp


目录
相关文章
|
1月前
|
人工智能 运维 机器人
2026年零基础部署OpenClaw(Clawdbot)集成QQ、微信、钉钉、飞书喂饭级教程
2026年,AI自动化代理已经成为个人办公、团队协作的标配工具。OpenClaw(曾用名Clawdbot、Moltbot)凭借轻量化、插件化、全平台兼容的特性,成为国内最受欢迎的开源AI助手框架。它可以通过自然语言完成信息查询、文案生成、代码编写、定时任务、文件处理等一系列自动化操作,真正实现“一句话交给AI,剩下的交给工具”。
2264 3
|
19天前
|
人工智能 JSON 架构师
Superpowers:Vibe Engineering 的第一站——让 Coding Agent 守点规矩
Vibe Coding追求快速迭代,但易致设计缺失、测试不足、行为不稳;Superpowers提出Vibe Engineering新范式,通过14项强制“技能”(如设计评审、TDD、子代理审查等),将工程纪律固化为AI必遵流程,实现“能跑也敢上线”。
625 1
|
3月前
|
前端开发 小程序 JavaScript
A2UI 规范与 AG-UI 协议:打造高效协同的界面开发体系
A2UI规范与AG-UI协议构建“设计-开发”协同闭环:前者统一视觉与交互标准,后者定义组件通信与跨平台适配,二者融合提升协作效率、保障体验一致,推动界面开发向标准化、可复用、高效能演进。
2150 0
|
1月前
|
人工智能 安全 API
2026年阿里云OpenClaw(Clawdbot/Moltbot)秒级部署指南 7×24小时专属AI助手轻松搭建
2026年1月,OpenClaw(曾用名Clawdbot、Moltbot,以下统称OpenClaw)在中外技术社区持续走红,从X、Reddit到中文技术圈频频刷屏。这款由Peter开发的AI Agent产品,以“专属生活助理”为核心定位,支持通过WhatsApp、Telegram、企业微信、QQ等主流聊天软件实现自然语言交互,完成邮件处理、日程管理、信息检索、自动化指令执行等各类任务,成为当下最受关注的私有化AI工具。
533 7
|
24天前
|
人工智能 监控 安全
小红书 AI自动化运营指南!OpenClaw(Clawdbot)零基础部署+小红书Skill集成+阿里云百炼API配置及避坑指南
在内容创作与账号运营竞争日益激烈的2026年,小红书运营面临着“选题难、创作久、互动繁、数据跟踪累”的共性痛点。传统运营模式下,单篇笔记从选题、文案撰写、配图制作到发布互动,往往需要4小时以上,长期日更对个人精力是巨大挑战。而OpenClaw(原Clawdbot)凭借强大的技能扩展生态与自动化执行能力,可搭建起“选题分析→内容生成→批量发布→互动管理→数据分析”的全流程小红书运营流水线,仅需一句指令即可启动自动化运营,24小时不间断维护账号,大幅降低运营成本。
1977 2
|
11天前
|
存储 人工智能 机器人
你养的龙虾,怎么才能越用越聪明?
通过三本说明书立人设、建记忆系统告别金鱼脑、开启“心跳”主动服务、积累技能复利、接入生态学本领、组建多智能体团队——龙虾的能力上限,就是你想象力的边界。
293 2
|
16天前
|
人工智能 监控 Linux
AI开发革命:阿里云/本地部署OpenClaw+Codex/Claude Code 搭建AI Agent集群指南+免费多模型API配置+避坑教程
OpenClaw+AI Agent集群的模式,彻底打破了独立开发者的效率天花板,让"一人创办百万美元公司"从愿景变为现实。其核心并非依赖更强的AI模型,而是通过精妙的架构设计,让业务上下文与代码实现各司其职,同时借助自动化闭环与自我进化机制,持续降低人工干预成本。
1084 1
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
解读论文《SkillOrchestra: Learning to Route Agents via Skill Transfer》
AI系统由多模型协作时,"派谁上场"是核心难题。现有方法要么无法应对多步骤任务,要么陷入"总调最贵模型"的死胡同。SkillOrchestra从历史轨迹提炼"技能手册",让编排器匹配最合适的智能体,性能提升22.5%,成本节省700倍。
188 1
|
13天前
|
人工智能 IDE API
阿里云百炼Coding Plan 可以接入VS Code、Trae、Cursor等IDE吗?
阿里云百炼Coding Plan支持VS Code、Trae、Cursor三款VS Code内核的AI编辑器,需安装Qwen Code等官方IDE插件接入。仅限AI编程工具或OpenClaw类Agent中使用,不支持API直调或工作流平台。(239字)