最近一年Agent产品演进趋势及用户洞察

简介: 深度盘点 2025-2026 年 AI Agent 产品变革,揭示从“对话”向“行动”的范式转移。通过分析 Manus、Claude Cowork 及阿里千问等案例,阐述行业如何基于用户的“工具饥渴”与执行痛点,打造具备自主规划与桌面操作能力的智能体,重塑人机协作新形态。

2025年开始被广泛讨论为“Agent元年”,标志着人工智能从以大语言模型(LLM)为核心的“对话”阶段,正式迈入以自主执行任务为核心的“行动”阶段。这一范式转移的背后,是各大科技巨头对用户需求的深刻洞察。本文旨在盘点自2025年初以来发布的一些(非Coding类) AI Agent产品,深入分析其设计背后的用户洞察,并探讨这些洞察如何塑造了新一代AI产品的形态。


01

核心洞察:从“对话”到“行动”的范式转移



在Agent浪潮兴起之前,以ChatGPT为代表的LLM主要扮演“知识引擎”和“对话伙伴”的角色。然而,用户在使用过程中逐渐暴露出两大核心痛点,这些痛点直接催生了Agent产品的诞生:


  1. 非技术用户的“工具饥渴”与“认知门槛”: 如Manus 联创观察到许多非技术同事如数据运营,为了完成数据分析等工作,不得不“借用”像Cursor这样的编码IDE。这表明非技术用户对自动化和复杂工具的需求是真实且强烈的,但他们缺乏合适的、低门槛的工具入口。同时,现有工具的复杂交互和授权机制(如Cursor执行过程中频繁的授权请求)对非技术用户构成了巨大的认知障碍,甚至可能导致严重的误操作。


  1. 任务执行的“最后一公里”摩擦: 无论是数据分析、网页操作还是跨App协作,用户发现AI可以给出完美的“答案”或“计划”,但无法自动完成后续的“执行”步骤。OpenAI的Operator正是基于用户需要AI完成多步骤、跨网页的“最后一公里”执行任务的洞察而生。Anthropic的Claude Cowork也源于类似的观察:用户不仅需要AI回答问题,更需要AI像一个“同事”一样,自主规划并完成整个项目。




02

产品盘点与用户洞察分析



以下是针对2025年以来发布的一些 AI Agent产品进行的盘点,重点聚焦其设计背后的用户洞察及产品设计如何响应了这些洞察。


产品名称

核心定位

用户洞察

设计响应

Manus

通用 AI Agent (GAI)

非技术用户对自动化工具的需求被编码IDE“借用”;复杂授权机制是认知门槛。

云环境执行任务,极简交互,通过云沙箱环境减少本地授权复杂度。

Claude Cowork

知识工作通用 Agent

Claude Code用户中大量非技术用户进行非编码任务;对终端操作的恐惧。

桌面端 UI,保留 Agent 规划能力,去除编码门槛。

OpenAI Operator

浏览器/计算机操作 Agent (CUA)

用户需要AI完成多步骤、跨网页的“最后一公里”执行任务。

浏览器接管模式,强化视觉理解与动作规划。

扣子空间

AI 办公协同平台

用户需要一站式、低门槛的 Agent 协作环境,将多种工具(PPT、文档、播客)串联。

提供探索/规划双模式,集成 100+ 任务自动化与 MCP 插件。

MiniMax Agent 2.0

AI 原生工作台

内部员工(运维、销售、研发)已广泛使用 Agent 作为“实习生”处理琐碎任务。

推出桌面端 App,引入“专家 Agent”功能,支持本地文件操作与网页自动化。

阶跃星辰 (小跃)

终端智能体 (Windows/Mac)

用户需要一个“总在场、有记忆”的伙伴,能直接操控电脑软件完成复杂长链条任务。

打造“会做事、总在场、有记忆、能进化”的桌面伙伴,支持网页/文件自主操作。

智谱 AutoGLM 2.0

手机/PC 通用智能体

移动端跨 App 协作的痛点;复杂操作对部分用户的障碍。

跨 App 自动执行,语音唤起,模拟人类点击。

Lovart

专业设计类 AI Agent

传统设计软件“Know-how”壁垒;设计流程碎片化。

自然语言驱动的全链路设计自动化。

千问 App

“会聊天、能办事”的个人AI智能体

用户厌倦在多App间跳转操作,渴望通过自然语言一句话直达端到端服务闭环。

以“生态协同+任务交付”为目标,深度打通阿里生态,以单一对话框实现400+项任务的免跳转闭环执行。


国际厂商:从“代码”到“通用”的平权运动


Claude Cowork 的案例是“用户行为驱动产品设计”的典型。Anthropic最初为开发者推出了强大的Claude Code,但通过分析用户数据发现,大量非技术用户也在“硬着头皮”使用它来处理文件管理、数据分析等非编码任务。这一洞察直接促使Anthropic推出了Cowork,将其定位为“Claude Code for the rest of your work”,通过提供一个友好的桌面端UI,抹平了终端操作的门槛,将强大的Agent能力赋能给更广泛的知识工作者。


OpenAI Operator 则聚焦于解决计算机操作的效率问题。OpenAI观察到,即使是经验丰富的用户,在进行在线订餐、购买机票等跨页面、多步骤任务时,仍需耗费大量精力进行点击、输入和验证。Operator基于“计算机使用代理”(Computer-Using Agent, CUA)模型,旨在通过视觉理解和动作规划,像人类一样接管浏览器,将用户的高层级意图转化为低层级操作,从而解放用户的双手。


国内厂商:从“实验室”走向“桌面工作台”


2026 年 1 月初始,国内 Agent 市场迎来了从“手机端”向“桌面端”的集体进化,强调 Agent 在真实办公环境中的“实习生”角色。


MiniMax Agent 2.0 的设计灵感直接来源于其内部的办公实践。MiniMax 发现,其内部运维、销售和研发人员早已将 Agent 作为“实习生”来分析告警、写私信或并行跑任务。这种“内部实践外溢”的洞察,促使其推出了具备“专家 Agent”功能的桌面端 App,旨在打造一个 AI 原生的工作台,让 Agent 能够直接调用本地素材并遵循行业规范完成工作。


阶跃星辰的“小跃” 则更强调 Agent 的“在场感”与“执行力”。阶跃星辰洞察到,用户在桌面办公时,最需要的是一个能打通主流办公软件(如 Office、浏览器等)的智能体。因此,“小跃”被设计为具备“有记忆、能进化”特性的终端智能体,能够自主完成网页和文件的浏览、填写、修改与创建,真正实现了“用语言操控电脑”。


扣子空间 (Coze Space) 则是字节跳动在 Agent 平台化方面的深度尝试。它洞察到用户在办公场景中需要一种“一站式协同”的体验,而不是在零散的 Agent 间切换。通过集成 AI 写作、PPT 生成、表格处理等全功能,扣子空间提供了一种“探索和规划双模式”,让用户能够以极低门槛构建并使用复杂的自动化工作流。



03

结论与展望



2025年至2026年初的 AI Agent 产品浪潮,是一场由用户洞察驱动的“行动”范式转移。无论是 Manus 对非技术用户“工具饥渴”的关注,还是 Claude Cowork 对“终端恐惧症”的消除,亦或是 MiniMax 和阶跃星辰对“桌面工作台”的重构,都指向了同一个核心趋势:AI Agent 正在从一个被动响应的“聊天机器人”,进化为一个主动执行任务、能够自主规划和使用工具的“数字同事”。


这些产品的设计灵感不再仅仅来源于技术突破,而是来源于对真实用户行为数据的分析和对内部办公范式的总结。未来的 Agent 竞争,将聚焦于谁能更深度地打通用户的本地环境与专业工作流,提供更具“专家感”的自主执行能力。


参考链接:

[1] OpenAI. (2025, January 23). Introducing Operator.

https://openai.com/index/introducing-operator/


[2] Anthropic. (2026, January 12). Introducing Cowork.

https://claude.com/blog/cowork-research-preview


[3] 对谈 Manus 联创

https://www.bilibili.com/video/BV1knvYBDEjs/


[4] 智谱AutoGLM 2.0发布.

https://zhuanlan.zhihu.com/p/1941482161719980485


[5] MiniMax Agent.

https://agent.minimaxi.com/docs/user-guide


[6] 阶跃星辰. (2026, January 19). 阶跃AI桌面伙伴 Windows 版上线.

https://mp.weixin.qq.com/s/1JTuwF5i1slj662_Rz1WSw


[7] 扣子空间.

https://docs.coze.cn/cozespace



目录
相关文章
|
3月前
|
SQL 人工智能 分布式计算
从工单、文档到结构化知识库:一套可复用的 Agent 知识采集方案
我们构建了一套“自动提取 → 智能泛化 → 增量更新 → 向量化同步”的全链路自动化 pipeline,将 Agent 知识库建设中的收集、提质与维护难题转化为简单易用的 Python 工具,让知识高效、持续、低门槛地赋能智能体。
635 36
|
3月前
|
人工智能 缓存 API
Dify:面向企业级LLM应用开发的现代化全栈框架深度技术解析
当 AI 应用从 Demo 走向生产,问题已不再只是模型效果,而是工程化与系统能力。本文从架构与实现机制出发,深入解析 Dify 作为 LLM 应用平台的设计思路、核心能力与边界,并探讨其在企业级场景中的真实价值与演进方向。
363 2
|
3月前
|
人工智能 测试技术 开发者
AI Coding后端开发实战:解锁AI辅助编程新范式
本文系统阐述了AI时代开发者如何高效协作AI Coding工具,强调破除认知误区、构建个人上下文管理体系,并精准判断AI输出质量。通过实战流程与案例,助力开发者实现从编码到架构思维的跃迁,成为人机协同的“超级开发者”。
2367 106
|
2月前
|
存储 API 数据库
投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库
Zvec 是一款开源(Apache 2.0)轻量级嵌入式向量数据库,专为终端侧设计,具备开箱即用、资源可控、极致性能与完整向量能力四大优势,支持标量-向量混合查询、CRUD、崩溃恢复等生产级特性,让端侧RAG如SQLite般简单可靠。(239字)
440 7
|
3月前
|
人工智能 数据可视化 Serverless
国产之光:Dify何以成为国内Workflow Agent开发者的首选工具
随着 LLM 技术发展,将LLM从概念验证推向生产时面临诸多挑战,如复杂Prompt工程、长上下文管理、缺乏生产级运维工具及快速迭代难等。Dify旨在通过融合后端即服务(BaaS)和LLMOps理念,为开发者提供一站式、可视化、生产就绪的解决方案。
1466 4
|
2月前
|
存储 缓存 测试技术
RAG 三大架构评测:在成本与准确度之间的权衡
本文从成本视角剖析RAG三大架构:向量RAG(高效低成本)、GraphRAG(高准低效高成本)、PageIndex(高准高成本)。指出当前基准测试过度关注准确率,忽视延迟、吞吐量与单次查询成本等生产关键指标,提出以延迟为先、匹配查询复杂度、计算TCO的选型框架。
545 5
|
3月前
|
人工智能 应用服务中间件 API
刚刚,阿里云上线Clawdbot全套云服务!
阿里云上线Moltbot(原Clawdbot)全套云服务,支持轻量服务器/无影云电脑一键部署,可调用百炼平台百余款千问模型,打通iMessage与钉钉消息通道,打造开箱即用的AI智能体助手。
5933 74
刚刚,阿里云上线Clawdbot全套云服务!
|
2月前
|
自然语言处理 数据库 开发者
PageIndex: 一种基于 LLM 推理的 RAG 架构(干货科普)
本文介绍开源项目 PageIndex,提出“推理即检索”新架构。它摒弃传统向量切块,利用 LLM 基于树状索引进行结构化导航,在 FinanceBench 评测中准确率达 98.7%。该方案有效解决长文档检索碎片化问题,虽涉及成本权衡,但为高精度知识问答提供了新的选择。
2466 3
|
2月前
|
运维 自然语言处理 IDE
Claude Opus 4.6进入“双模式时代”:企业是否需要选择“快速模式”?
大模型成熟后,企业关注点转向效率、可控性与规模化部署。Anthropic推出Claude Opus 4.6“快速模式”,形成双结构设计。本文从企业视角解析:何时需要快速模式、是否真正降本、如何在云架构中放大价值,揭示双模式正成为高端模型工程化新标配。
|
3月前
|
人工智能 安全 调度
AI工程vs传统工程 —「道法术」中的变与不变
本文从“道、法、术”三个层面对比AI工程与传统软件工程的异同,指出AI工程并非推倒重来,而是在传统工程坚实基础上,为应对大模型带来的不确定性(如概率性输出、幻觉、高延迟等)所进行的架构升级:在“道”上,从追求绝对正确转向管理概率预期;在“法”上,延续分层解耦、高可用等原则,但建模重心转向上下文工程与不确定性边界控制;在“术”上,融合传统工程基本功与AI新工具(如Context Engineering、轨迹可视化、多维评估体系),最终以确定性架构驾驭不确定性智能,实现可靠价值交付。
592 41
AI工程vs传统工程 —「道法术」中的变与不变