清华、面壁提出创新AI Agent交互:能主动思考、预测需求

简介: 清华大学与面壁智能团队提出了一种创新的AI Agent交互模式,将基于大型语言模型的智能体从被动响应转变为主动协助。通过数据驱动的方法,研究团队开发了能够预测和主动发起任务的智能体,并创建了ProactiveBench数据集。实验结果显示,经过微调的模型在主动性方面取得了66.47%的F1分数,展示了该方法在人机协作中的潜力。论文链接:https://arxiv.org/abs/2410.12361

清华大学与面壁智能团队近日提出了一种创新的AI Agent交互模式,该模式旨在将基于大型语言模型的智能体从被动响应转变为主动协助。这项研究的核心在于开发一种能够预测和主动发起任务的智能体,而无需明确的人类指令。

传统上,AI Agent主要依赖于人类的输入来执行任务,这种反应式的工作模式在需要预见性和自主决策的场景中存在局限性。为了解决这一问题,研究团队采用了一种数据驱动的方法,通过收集现实世界中的人类活动数据来生成主动任务预测。这些预测随后由人类标注员进行评估,以确定其是否被接受或拒绝。

基于这些标注数据,研究团队训练了一个奖励模型,该模型能够模拟人类的判断,并作为评估AI Agent主动性的自动评估器。通过这个奖励模型,研究团队开发了一套全面的数据生成流程,创建了一个名为ProactiveBench的多样化数据集,其中包含6,790个事件。

通过在ProactiveBench上进行微调,研究团队成功地激发了AI Agent的主动性。实验结果表明,经过微调的模型在主动提供帮助方面取得了66.47%的F1分数,超过了所有开源和闭源模型。这一成果展示了该方法在创建更主动、更有效的智能体系统方面的潜力,为未来人机协作的发展奠定了基础。

这项研究的创新之处在于,它不仅关注AI Agent在特定任务上的表现,还强调了智能体在没有明确指令的情况下主动思考和预测人类需求的能力。这种主动性对于实现更自然、更无缝的人机交互至关重要,特别是在需要智能体能够理解和适应人类行为和意图的场景中。

然而,这项研究也存在一些挑战和限制。首先,数据收集和标注过程可能需要大量的时间和资源,尤其是在创建一个多样化、具有代表性的数据集时。其次,奖励模型的准确性和鲁棒性对于评估AI Agent的主动性至关重要,但可能受到训练数据的质量和多样性的影响。此外,在实际应用中,如何平衡AI Agent的主动性和用户的期望和偏好也是一个需要考虑的问题。

这项研究的成果也为未来的研究提供了方向。例如,如何进一步提高AI Agent的主动性和适应性,如何设计更有效的奖励模型和数据生成流程,以及如何在实际应用中平衡智能体的主动性和用户的期望和偏好等。这些问题都需要进一步的研究和探索,以推动AI Agent技术的发展和应用。

论文链接:https://arxiv.org/abs/2410.12361

目录
相关文章
|
27天前
|
人工智能 搜索推荐 数据可视化
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
275 115
|
27天前
|
人工智能 自然语言处理 安全
从工具到伙伴:AI代理(Agent)是下一场革命
从工具到伙伴:AI代理(Agent)是下一场革命
234 117
|
27天前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
2320 40
|
24天前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
330 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
1月前
|
人工智能 Cloud Native 搜索推荐
【2025云栖大会】阿里云AI搜索年度发布:开启Agent时代,重构搜索新范式
2025云栖大会阿里云AI搜索专场上,发布了年度AI搜索技术与产品升级成果,推出Agentic Search架构创新与云原生引擎技术突破,实现从“信息匹配”到“智能问题解决”的跨越,支持多模态检索、百亿向量处理,助力企业降本增效,推动搜索迈向主动服务新时代。
262 22
|
1月前
|
存储 人工智能 前端开发
超越问答:深入理解并构建自主决策的AI智能体(Agent)
如果说RAG让LLM学会了“开卷考试”,那么AI智能体(Agent)则赋予了LLM“手和脚”,使其能够思考、规划并与真实世界互动。本文将深入剖析Agent的核心架构,讲解ReAct等关键工作机制,并带你一步步构建一个能够调用外部工具(API)的自定义Agent,开启LLM自主解决复杂任务的新篇章。
265 6
|
30天前
|
人工智能 监控 Java
Spring AI Alibaba实践|后台定时Agent
基于Spring AI Alibaba框架,可构建自主运行的AI Agent,突破传统Chat模式限制,支持定时任务、事件响应与人工协同,实现数据采集、分析到决策的自动化闭环,提升企业智能化效率。
Spring AI Alibaba实践|后台定时Agent
|
24天前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
340 29
|
1月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
379 23
|
2月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
701 35

热门文章

最新文章