文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理文章正文

Proactive Agent：清华联合面壁智能开源的新一代主动Agent交互范式

2024-12-02 1549

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Proactive Agent是由清华大学联合面壁智能等团队推出的新一代主动Agent交互范式。它具备主动性，能够预测用户需求并在没有直接指令的情况下采取行动。本文详细介绍了Proactive Agent的主要功能、技术原理以及如何运行和评估其性能。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

主动性：Proactive Agent能够主动观察环境和用户行为，预测用户需求并自主采取行动。
功能多样：包括环境观察与预判、自主决策、任务发起、上下文感知、用户交互和任务执行。
技术支持：基于环境模拟器、主动智能体、用户智能体、数据生成管道和奖励模型等技术实现。

正文（附运行示例）

Proactive Agent 是什么

公众号: 蚝油菜花 - ProactiveAgent

Proactive Agent是清华大学联合面壁智能等团队推出的新一代主动Agent交互范式。它具备主动性，能够预测用户需求并在没有直接指令的情况下采取行动。Proactive Agent通过观察环境和用户行为，推断出潜在的任务，并自主提供帮助。

与传统的被动式AI代理相比，Proactive Agent展现出更高的自主决策能力和环境适应性，能够在多种场景下实现更自然、更流畅的人机交互体验。这一技术的发展标志着AI从简单的命令执行者向具有洞察力和主动帮助能力的智能协作伙伴的转变。

Proactive Agent 的主要功能

环境观察与预判：主动观察用户的环境和行为，预测用户的需求和意图。
自主决策：基于对环境的理解和用户的意图，自主做出决策，不需要等待用户的明确指令。
任务发起：在识别到用户可能需要帮助时，主动提出任务或提供信息。
上下文感知：理解上下文环境，根据当前情境提供恰当的协助。
用户交互：与用户进行交互，根据用户反馈调整其行为和预测，提高准确性和用户满意度。
任务执行：用户接受Proactive Agent提出的任务，系统将执行这些任务，并根据需要生成后续事件。

Proactive Agent 的技术原理

环境模拟器（Environment Gym）：模拟特定环境，生成事件序列，维护环境状态，为代理提供交互的沙盒条件。
主动智能体（Proactive Agent）：接收环境模拟器的输入，更新记忆，结合历史交互和用户反馈，预测用户意图，并生成任务。
用户智能体（User Agent）：模拟用户行为，对Proactive Agent提出的任务做出反馈，决定是否接受任务。
数据生成管道：基于模拟用户活动和响应，生成用在训练和评估模型的数据。
奖励模型：训练一个模型评估Proactive Agent的主动行为，模拟人类判断，提供反馈，优化代理的行为。
性能评估：用度量方式（如需求遗落、静默应答、正确检测、错误检测）评估Proactive Agent的性能，并进行持续优化。

如何运行 Proactive Agent

安装

克隆仓库并进入目录：

git clone git@github.com:thunlp/ProactiveAgent
cd ProactiveAgent

创建并激活虚拟环境，安装依赖：

conda create -n activeagent python=3.10
conda activate activeagent
pip install -r requirements.txt

配置

复制配置文件示例并进行修改：
```
cp example_config.toml private.toml
```
修改private.toml文件中的default_completions_model、api_key和base_url为你的设置。

运行 Proactive Agent

进入./agent目录，按照README中的说明运行Proactive Agent。

资源

项目官网：https://mimictalk.github.io/
GitHub 仓库：https://github.com/thunlp/ProactiveAgent
arXiv 技术论文：https://arxiv.org/pdf/2410.12361
Activity Watcher：https://activitywatch.net/

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

文章标签：

自然语言处理

人工智能

人机交互

蚝油菜花

目录

相关文章

小空门123-30335

|

机器学习/深度学习算法 Python

强化学习（Reinforcement Learning, RL）** 是一种机器学习技术，其中智能体（Agent）通过与环境（Environment）交互来学习如何执行决策以最大化累积奖励。

强化学习（Reinforcement Learning, RL）** 是一种机器学习技术，其中智能体（Agent）通过与环境（Environment）交互来学习如何执行决策以最大化累积奖励。

小空门123-30335

892 0 0

同学小张

|

人工智能决策智能

【AI Agent系列】【阿里AgentScope框架】2. Pipeline模块入门：使用Pipeline模块实现最简单的多智能体交互

【AI Agent系列】【阿里AgentScope框架】2. Pipeline模块入门：使用Pipeline模块实现最简单的多智能体交互

同学小张

1380 0 0

ModelScope运营小助手

|

API 文件存储决策智能

抢鲜评测AgentScope：Agent+游戏制作+视频生成的新范式

LLM-Powered Agent凭借长期记忆+自主规划+自动执行等特性，是探索人工通用智能(AGI)的可能途径之一；而Multi-Agent让多个agent通讯来实现协作，也模拟了人类社交及工作协同场景，旨在探索更高质高效的人机协作模式。

ModelScope运营小助手

1299 0 0

小小工匠

|

运维监控

JPOM - Agent启动流程&交互源码解析

JPOM - Agent启动流程&交互源码解析

小小工匠

279 0 0

阿里云开发者

|

存储人工智能自然语言处理

AI经营｜多Agent择优生成商品标题

商品标题中关键词的好坏是商品能否被主搜检索到的关键因素，使用大模型自动优化标题成为【AI经营】中的核心能力之一，本文讲述大模型如何帮助商家优化商品素材，提升商品竞争力。

阿里云开发者

1842 62 63

AI经营｜多Agent择优生成商品标题

蚝油菜花

|

机器学习/深度学习人工智能自然语言处理

Gemini 2.0：谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型

谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型，以Agent技术为核心，支持多种数据类型的输入与输出，具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。

蚝油菜花

1587 20 20

Gemini 2.0：谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型

蚝油菜花

|

人工智能自然语言处理前端开发

Director：构建视频智能体的 AI 框架，用自然语言执行搜索、编辑、合成和生成等复杂视频任务

Director 是一个构建视频智能体的 AI 框架，用户可以通过自然语言命令执行复杂的视频任务，如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施，集成了多个预构建的视频代理和 AI API，支持高度定制化，适用于开发者和创作者。

蚝油菜花

1283 9 10

Director：构建视频智能体的 AI 框架，用自然语言执行搜索、编辑、合成和生成等复杂视频任务

蚝油菜花

|

机器学习/深度学习人工智能算法

Meta Motivo：Meta 推出能够控制数字智能体动作的 AI 模型，提升元宇宙互动体验的真实性

Meta Motivo 是 Meta 公司推出的 AI 模型，旨在控制数字智能体的全身动作，提升元宇宙体验的真实性。该模型通过无监督强化学习算法，能够实现零样本学习、行为模仿与生成、多任务泛化等功能，适用于机器人控制、虚拟助手、游戏角色动画等多个应用场景。

蚝油菜花

549 4 4

Meta Motivo：Meta 推出能够控制数字智能体动作的 AI 模型，提升元宇宙互动体验的真实性

蚝油菜花

|

人工智能自然语言处理 JavaScript

Agent-E：基于 AutoGen 代理框架构建的 AI 浏览器自动化系统

Agent-E 是一个基于 AutoGen 代理框架构建的智能自动化系统，专注于浏览器内的自动化操作。它能够执行多种复杂任务，如填写表单、搜索和排序电商产品、定位网页内容等，从而提高在线效率，减少重复劳动。本文将详细介绍 Agent-E 的功能、技术原理以及如何运行该系统。

蚝油菜花

1445 5 5

Agent-E：基于 AutoGen 代理框架构建的 AI 浏览器自动化系统

土木林森

|

Python 机器学习/深度学习人工智能

手把手教你从零开始构建并训练你的第一个强化学习智能体：深入浅出Agent项目实战，带你体验编程与AI结合的乐趣

【10月更文挑战第1天】本文通过构建一个简单的强化学习环境，演示了如何创建和训练智能体以完成特定任务。我们使用Python、OpenAI Gym和PyTorch搭建了一个基础的智能体，使其学会在CartPole-v1环境中保持杆子不倒。文中详细介绍了环境设置、神经网络构建及训练过程。此实战案例有助于理解智能体的工作原理及基本训练方法，为更复杂应用奠定基础。首先需安装必要库： ```bash pip install gym torch ``` 接着定义环境并与之交互，实现智能体的训练。通过多个回合的试错学习，智能体逐步优化其策略。这一过程虽从基础做起，但为后续研究提供了良好起点。

土木林森

2673 4 4

手把手教你从零开始构建并训练你的第一个强化学习智能体：深入浅出Agent项目实战，带你体验编程与AI结合的乐趣

ModelScope模型即服务

自然语言处理

热门文章

最新文章

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

KTransformers：告别天价显卡！国产框架让单卡24G显存跑DeepSeek-R1 671B大模型：推理速度飙升28倍

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

Open Interpreter：AI 赋能终端！在终端中对话AI模型进行编程，通过运行代码来完成各种计算机操作任务

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

RuoYi AI：1人搞定AI中台！开源全栈式AI开发平台，快速集成大模型+RAG+支付等模块

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

保密检查在本项目中的总体链路：从按钮到任务清单：免费开源的文档编审软件WPS AI插件.察元AI 文档助手

语义压缩，才是提示词工程的底层心法

一句话查高铁票并写入文件：揭秘 IntentOrch 的意图驱动编排黑科技

[大模型实战 05] 大模型实战的杀手锏：模型微调

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

写小说时，Claude 4.0 和 4.5 的差别在哪里？

基于Qwen-3B-Raw的本地化SD Prompt生成器研究

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！