生成式智能体——来自NPC们的独立宣言

简介: 生成式智能体——来自NPC们的独立宣言

 新智元报道  

编辑:拉燕

【新智元导读】Q版西部世界!生成式智能体来袭,我们是人格独立的NPC!


游戏里的NPC都见过吧?

不管NPC是干嘛的,有任务的接任务,没任务的尬聊,他们共同的特点就是——翻来覆去就是那几句话。

原因也很简单,这些NPC还不够智能。

换句话说,传统的NPC都是先给他们安排好剧本,安排好话术,该到哪步就说哪句话。

而随着ChatGPT的出现,这些游戏角色的对话可以在只输入关键信息的前提下,自我生成。

这就是斯坦福和谷歌的研究者们在做的事——用人工智能创造出的生成式智能体。

生成式智能体怎么生成?


这玩意儿的机理其实很简单,用一张图就可以简单进行概括。

最左边的Perceive就像是最开始的输入,智能体开始接收各类信息。

而中间的大框框,就是最主要的部分了,这里揭示了生成式智能体是怎么「生成」内容的,并且自发地走到最后一步「Act」。

生成式智能体最主要的特点就是有个Memory Stream,也就是内存流。

就像上面提到的传统npc,他们的行为和言语都是规定好的,没有自由发挥的空间。

而如果想自由发挥,就必须有自己的「库」,这个「库」里有AI记下的日常所见、所听的事物,并加以思考,这样才能进一步「Act」。

AI必须得学习嘛。

而提取记忆、计划、反思的环节,就是AI处理记忆的环节。AI不光能记住每天发生了什么,还能反思这些事件,制定每一天的计划。

同时,由AI的行为所引起的新反馈,他们也会记住,并当成新的素材,继续展开新一轮的处理。

Observation就是每个角色对周遭环境以及人、事的观察,Reflection则是对这些观察到的现象的思考。

然后角色们再根据这些内容生成Plan。

一开始,他们先自己制定出大致的计划,然后慢慢细化。先是制定小时计划,再制定出5-15分钟的短期计划。

并且,角色还会根据周遭环境的变化修改各自的计划。完全模仿人类行为,谁不是一天到头疯狂修改自己的计划的呢。

这样,我们就看到了生成式智能体的魅力。

我们可以看到,完全体的生成式智能体(包含观察、思考、计划三部分)的表现要比缺少任何一种、两种的架构表现好得多。

可爱小人Emoji

在谷歌和斯坦福研究人员设计的场景下,一共有25个小AI人,生活在这么一张地图中。

研究人员一共设置了25个角色,并且给每个角色都设定了姓名和职业等基本信息。

比方说,John Lin是一个药店店员,十分乐于助人。他总是在思考如何让他的客户更方便地拿药。

生活方面,John和他的妻子Mei Lin一起生活,后者是一个大学教授。他们的儿子Eddy Lin正在学习音乐理论。

同时还建立了角色之间初始的关系网,比如John和他邻居的关系,对邻居的看法,以及和药店同事之间的关系,平时爱聊什么等等。

每一个角色都有这么一段预设的文字,初步勾勒出了角色框架,引发后续的交互。

而剩下的部分,就靠AI自己发挥了。

每个角色的行为都会由emoji表示,并且会在系统中用一句话概括。比如某某正在写日记,就会用来表示。

有一天,Isabella和Tom相遇。他们聊起了有关竞选的话题。

要知道,角色之间能使用完整清晰的自然语言进行交流。并且每个角色都能感知到附近的其他角色,并能根据各自的性格和人物关系来自行决定,是擦肩而过还是开始攀谈。

Isabella:「我还在想我该选谁。但我和Sam Moore聊过竞选的事。你对他是什么看法?」

Tom:「讲实话,我不是很喜欢Sam。我觉得他有点脱离咱们的社区,不会为咱们的利益最大化而考虑。」

而出于试验的目的,研究人员还可以进行干预。不过这种干预不同于传统的输入剧本。而是在一些分支的走向上稍微施加一点力量,余下的部分还是靠AI自己发挥。

而具体到每一天的日常,每一个角色都会有自己的「routine」,这个「routine」是预设的。

以下就是药房小哥John Lin的一天。而至于每天会发生什么新鲜事,就是最有意思的部分了。

最后,再让我们看看情人节这天AI之间发生了什么有趣的互动吧。

在情人节这天,研究人员给了两个角色Isabella和Maria一人一条预设信息,告诉Isabella她要举办一场派对,并告诉Maria她喜欢Klaus。

然后,两个角色就开始自己玩自己的了。

Isabella在地图中溜达,看见人就邀请他们来自己的派对。

这其中就包括Maria。Maria肯定也不会错过这个机会和Klaus相处,于是她找到Klaus,邀请他一同前往Isabella的派对。

Isabella邀请完人也没闲着,去咖啡厅装饰了场地,还请来了Maria帮忙。

上面这张图展现了这些AI相互之间的关系,以及由派对引发的交互。

然后一群AI就快快乐乐地在下午五点开始派对了。

下面这张图则是详细地展开了这场派对的举办是怎么由AI自发引导的。涉及到了记忆的提取、从对环境的观察中进行的反思,以及决策。

左侧是Isabella观察到的环境内容,比如闲置的冰箱、床、架子、书桌、衣柜等等,然后根据环境和要举办派对的意图,做出了装饰、邀请、设计派对等等决策。

如此一来,整个过程就显得非常饱满了。

科幻照进现实?


以上的场景看似简单好玩,但是越发展越能展现出不一样的力量。

Pete在推特上表示,这个成果未来可以应用在很多方面。

比如说应用在VR世界,有了这种生成式智能体充当npc,想必像西部世界里设想的场景不再会是遥不可及的。

「在西部世界中,每一个NPC都有自己的思想,性格,计划,以及人际关系。甚至,更多的东西都是自主生成的。」而由谷歌和斯坦福的研究者们做的这个玩意儿,就是个迷你的Q版西部世界。

参考资料:https://twitter.com/nonmayorpete/status/1645355225157615616 https://www.reddit.com/r/MachineLearning/comments/12hluz1/r_generative_agents_interactive_simulacra_of/

相关文章
|
12天前
|
人工智能 前端开发 API
基于agentscope的多智能体游戏场景-骗子酒馆
骗子酒馆是一款基于多智能体系统的在线社交推理游戏,玩家通过掷骰子和扑克牌进行智力和心理博弈,结合大语言模型技术,每个游戏角色由AI扮演,具备独特的性格和决策逻辑,提供高度沉浸式的体验。游戏采用黑板通信模式,确保信息高效交换,支持多种角色如胆小鬼、占卜师等,每个角色拥有特定的技能和行为模式,增强游戏的策略深度和互动性。游戏界面简洁,操作流畅,适合喜欢心理战和策略游戏的玩家。文章末尾有源码和体验地址。
88 13
|
3月前
|
机器学习/深度学习 人工智能 编解码
深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
【9月更文挑战第2天】深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
 深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
|
2月前
|
机器学习/深度学习 自然语言处理 搜索推荐
深度学习之个性化助手与定制对话
基于深度学习的个性化助手与定制对话技术,旨在为用户提供具有个性化、上下文感知的对话体验。这类助手系统能够通过用户的偏好、对话历史以及特定需求定制回答,广泛应用于智能客服、个人助理、教育和娱乐等领域。个性化助手通过分析用户数据和生成自然的对话内容,模拟出人性化的交互效果,使用户感到更被理解和支持。
59 0
|
3月前
|
人工智能
AI工具:Gnomic智能体
AI工具:Gnomic智能体
59 0
|
4月前
|
人工智能 数据挖掘 决策智能
跟着我的步骤,轻松打造出 AI 智能体
跟着我的步骤,轻松打造出 AI 智能体
126 3
跟着我的步骤,轻松打造出 AI 智能体
|
7月前
|
人工智能 自然语言处理 算法
GPT-4o:重塑AI语音对话的边界与机遇
最近技术圈又出了新的“爆炸”新闻,因为OpenAI再次掀起技术浪潮,发布了最新旗舰模型GPT-4o,通过官方的消息显示这款全新的模型凭借超高速的语音响应能力和多模态交互革新,不仅让AI语音对话的交互体验更加流畅自然,还以免费使用的形式,给用户和行业带来了前所未有的震撼。那么GPT-4o相比前代有哪些显著的技术提升?它的发布又为国内大模型行业带来了哪些机会呢?本文就来简单聊一聊,欢迎大家在评论区留言交流。
129 2
GPT-4o:重塑AI语音对话的边界与机遇
|
6月前
|
人工智能 自然语言处理 数据安全/隐私保护
扣子(Coze)搭建一个AI智能体
扣子(Coze)搭建一个AI智能体
1207 2
|
7月前
|
人工智能 自然语言处理 搜索推荐
【AGI】智能体简介及场景分析
【4月更文挑战第14天】AI时代,智能体的意义,使用场景及对未来的意义
189 1
|
7月前
|
人工智能 前端开发 决策智能
【AI Agent系列】【MetaGPT多智能体学习】5. 多智能体案例拆解 - 基于MetaGPT的智能体辩论(附完整代码)
【AI Agent系列】【MetaGPT多智能体学习】5. 多智能体案例拆解 - 基于MetaGPT的智能体辩论(附完整代码)
259 0
|
机器学习/深度学习 算法 决策智能
多智能体强化学习(一) IQL、VDN、QMIX、QTRAN算法详解
多智能体强化学习(一) IQL、VDN、QMIX、QTRAN算法详解
1997 0
下一篇
DataWorks