2025年开始被广泛讨论为“Agent元年”,标志着人工智能从以大语言模型(LLM)为核心的“对话”阶段,正式迈入以自主执行任务为核心的“行动”阶段。这一范式转移的背后,是各大科技巨头对用户需求的深刻洞察。本文旨在盘点自2025年初以来发布的一些(非Coding类) AI Agent产品,深入分析其设计背后的用户洞察,并探讨这些洞察如何塑造了新一代AI产品的形态。
01
—
核心洞察:从“对话”到“行动”的范式转移
在Agent浪潮兴起之前,以ChatGPT为代表的LLM主要扮演“知识引擎”和“对话伙伴”的角色。然而,用户在使用过程中逐渐暴露出两大核心痛点,这些痛点直接催生了Agent产品的诞生:
- 非技术用户的“工具饥渴”与“认知门槛”: 如Manus 联创观察到许多非技术同事如数据运营,为了完成数据分析等工作,不得不“借用”像Cursor这样的编码IDE。这表明非技术用户对自动化和复杂工具的需求是真实且强烈的,但他们缺乏合适的、低门槛的工具入口。同时,现有工具的复杂交互和授权机制(如Cursor执行过程中频繁的授权请求)对非技术用户构成了巨大的认知障碍,甚至可能导致严重的误操作。
- 任务执行的“最后一公里”摩擦: 无论是数据分析、网页操作还是跨App协作,用户发现AI可以给出完美的“答案”或“计划”,但无法自动完成后续的“执行”步骤。OpenAI的Operator正是基于用户需要AI完成多步骤、跨网页的“最后一公里”执行任务的洞察而生。Anthropic的Claude Cowork也源于类似的观察:用户不仅需要AI回答问题,更需要AI像一个“同事”一样,自主规划并完成整个项目。
02
—
产品盘点与用户洞察分析
以下是针对2025年以来发布的一些 AI Agent产品进行的盘点,重点聚焦其设计背后的用户洞察及产品设计如何响应了这些洞察。
产品名称 |
核心定位 |
用户洞察 |
设计响应 |
Manus |
通用 AI Agent (GAI) |
非技术用户对自动化工具的需求被编码IDE“借用”;复杂授权机制是认知门槛。 |
云环境执行任务,极简交互,通过云沙箱环境减少本地授权复杂度。 |
Claude Cowork |
知识工作通用 Agent |
Claude Code用户中大量非技术用户进行非编码任务;对终端操作的恐惧。 |
桌面端 UI,保留 Agent 规划能力,去除编码门槛。 |
OpenAI Operator |
浏览器/计算机操作 Agent (CUA) |
用户需要AI完成多步骤、跨网页的“最后一公里”执行任务。 |
浏览器接管模式,强化视觉理解与动作规划。 |
扣子空间 |
AI 办公协同平台 |
用户需要一站式、低门槛的 Agent 协作环境,将多种工具(PPT、文档、播客)串联。 |
提供探索/规划双模式,集成 100+ 任务自动化与 MCP 插件。 |
MiniMax Agent 2.0 |
AI 原生工作台 |
内部员工(运维、销售、研发)已广泛使用 Agent 作为“实习生”处理琐碎任务。 |
推出桌面端 App,引入“专家 Agent”功能,支持本地文件操作与网页自动化。 |
阶跃星辰 (小跃) |
终端智能体 (Windows/Mac) |
用户需要一个“总在场、有记忆”的伙伴,能直接操控电脑软件完成复杂长链条任务。 |
打造“会做事、总在场、有记忆、能进化”的桌面伙伴,支持网页/文件自主操作。 |
智谱 AutoGLM 2.0 |
手机/PC 通用智能体 |
移动端跨 App 协作的痛点;复杂操作对部分用户的障碍。 |
跨 App 自动执行,语音唤起,模拟人类点击。 |
Lovart |
专业设计类 AI Agent |
传统设计软件“Know-how”壁垒;设计流程碎片化。 |
自然语言驱动的全链路设计自动化。 |
千问 App |
“会聊天、能办事”的个人AI智能体 |
用户厌倦在多App间跳转操作,渴望通过自然语言一句话直达端到端服务闭环。 |
以“生态协同+任务交付”为目标,深度打通阿里生态,以单一对话框实现400+项任务的免跳转闭环执行。 |
国际厂商:从“代码”到“通用”的平权运动
Claude Cowork 的案例是“用户行为驱动产品设计”的典型。Anthropic最初为开发者推出了强大的Claude Code,但通过分析用户数据发现,大量非技术用户也在“硬着头皮”使用它来处理文件管理、数据分析等非编码任务。这一洞察直接促使Anthropic推出了Cowork,将其定位为“Claude Code for the rest of your work”,通过提供一个友好的桌面端UI,抹平了终端操作的门槛,将强大的Agent能力赋能给更广泛的知识工作者。
OpenAI Operator 则聚焦于解决计算机操作的效率问题。OpenAI观察到,即使是经验丰富的用户,在进行在线订餐、购买机票等跨页面、多步骤任务时,仍需耗费大量精力进行点击、输入和验证。Operator基于“计算机使用代理”(Computer-Using Agent, CUA)模型,旨在通过视觉理解和动作规划,像人类一样接管浏览器,将用户的高层级意图转化为低层级操作,从而解放用户的双手。
国内厂商:从“实验室”走向“桌面工作台”
2026 年 1 月初始,国内 Agent 市场迎来了从“手机端”向“桌面端”的集体进化,强调 Agent 在真实办公环境中的“实习生”角色。
MiniMax Agent 2.0 的设计灵感直接来源于其内部的办公实践。MiniMax 发现,其内部运维、销售和研发人员早已将 Agent 作为“实习生”来分析告警、写私信或并行跑任务。这种“内部实践外溢”的洞察,促使其推出了具备“专家 Agent”功能的桌面端 App,旨在打造一个 AI 原生的工作台,让 Agent 能够直接调用本地素材并遵循行业规范完成工作。
阶跃星辰的“小跃” 则更强调 Agent 的“在场感”与“执行力”。阶跃星辰洞察到,用户在桌面办公时,最需要的是一个能打通主流办公软件(如 Office、浏览器等)的智能体。因此,“小跃”被设计为具备“有记忆、能进化”特性的终端智能体,能够自主完成网页和文件的浏览、填写、修改与创建,真正实现了“用语言操控电脑”。
扣子空间 (Coze Space) 则是字节跳动在 Agent 平台化方面的深度尝试。它洞察到用户在办公场景中需要一种“一站式协同”的体验,而不是在零散的 Agent 间切换。通过集成 AI 写作、PPT 生成、表格处理等全功能,扣子空间提供了一种“探索和规划双模式”,让用户能够以极低门槛构建并使用复杂的自动化工作流。
03
—
结论与展望
2025年至2026年初的 AI Agent 产品浪潮,是一场由用户洞察驱动的“行动”范式转移。无论是 Manus 对非技术用户“工具饥渴”的关注,还是 Claude Cowork 对“终端恐惧症”的消除,亦或是 MiniMax 和阶跃星辰对“桌面工作台”的重构,都指向了同一个核心趋势:AI Agent 正在从一个被动响应的“聊天机器人”,进化为一个主动执行任务、能够自主规划和使用工具的“数字同事”。
这些产品的设计灵感不再仅仅来源于技术突破,而是来源于对真实用户行为数据的分析和对内部办公范式的总结。未来的 Agent 竞争,将聚焦于谁能更深度地打通用户的本地环境与专业工作流,提供更具“专家感”的自主执行能力。
参考链接:
[1] OpenAI. (2025, January 23). Introducing Operator.
https://openai.com/index/introducing-operator/
[2] Anthropic. (2026, January 12). Introducing Cowork.
https://claude.com/blog/cowork-research-preview
[3] 对谈 Manus 联创
https://www.bilibili.com/video/BV1knvYBDEjs/
[4] 智谱AutoGLM 2.0发布.
https://zhuanlan.zhihu.com/p/1941482161719980485
[5] MiniMax Agent.
https://agent.minimaxi.com/docs/user-guide
[6] 阶跃星辰. (2026, January 19). 阶跃AI桌面伙伴 Windows 版上线.
https://mp.weixin.qq.com/s/1JTuwF5i1slj662_Rz1WSw
[7] 扣子空间.
https://docs.coze.cn/cozespace