生成式智能体——来自NPC们的独立宣言

简介: 生成式智能体——来自NPC们的独立宣言

 新智元报道  

编辑:拉燕

【新智元导读】Q版西部世界!生成式智能体来袭,我们是人格独立的NPC!


游戏里的NPC都见过吧?

不管NPC是干嘛的,有任务的接任务,没任务的尬聊,他们共同的特点就是——翻来覆去就是那几句话。

原因也很简单,这些NPC还不够智能。

换句话说,传统的NPC都是先给他们安排好剧本,安排好话术,该到哪步就说哪句话。

而随着ChatGPT的出现,这些游戏角色的对话可以在只输入关键信息的前提下,自我生成。

这就是斯坦福和谷歌的研究者们在做的事——用人工智能创造出的生成式智能体。

生成式智能体怎么生成?


这玩意儿的机理其实很简单,用一张图就可以简单进行概括。

最左边的Perceive就像是最开始的输入,智能体开始接收各类信息。

而中间的大框框,就是最主要的部分了,这里揭示了生成式智能体是怎么「生成」内容的,并且自发地走到最后一步「Act」。

生成式智能体最主要的特点就是有个Memory Stream,也就是内存流。

就像上面提到的传统npc,他们的行为和言语都是规定好的,没有自由发挥的空间。

而如果想自由发挥,就必须有自己的「库」,这个「库」里有AI记下的日常所见、所听的事物,并加以思考,这样才能进一步「Act」。

AI必须得学习嘛。

而提取记忆、计划、反思的环节,就是AI处理记忆的环节。AI不光能记住每天发生了什么,还能反思这些事件,制定每一天的计划。

同时,由AI的行为所引起的新反馈,他们也会记住,并当成新的素材,继续展开新一轮的处理。

Observation就是每个角色对周遭环境以及人、事的观察,Reflection则是对这些观察到的现象的思考。

然后角色们再根据这些内容生成Plan。

一开始,他们先自己制定出大致的计划,然后慢慢细化。先是制定小时计划,再制定出5-15分钟的短期计划。

并且,角色还会根据周遭环境的变化修改各自的计划。完全模仿人类行为,谁不是一天到头疯狂修改自己的计划的呢。

这样,我们就看到了生成式智能体的魅力。

我们可以看到,完全体的生成式智能体(包含观察、思考、计划三部分)的表现要比缺少任何一种、两种的架构表现好得多。

可爱小人Emoji

在谷歌和斯坦福研究人员设计的场景下,一共有25个小AI人,生活在这么一张地图中。

研究人员一共设置了25个角色,并且给每个角色都设定了姓名和职业等基本信息。

比方说,John Lin是一个药店店员,十分乐于助人。他总是在思考如何让他的客户更方便地拿药。

生活方面,John和他的妻子Mei Lin一起生活,后者是一个大学教授。他们的儿子Eddy Lin正在学习音乐理论。

同时还建立了角色之间初始的关系网,比如John和他邻居的关系,对邻居的看法,以及和药店同事之间的关系,平时爱聊什么等等。

每一个角色都有这么一段预设的文字,初步勾勒出了角色框架,引发后续的交互。

而剩下的部分,就靠AI自己发挥了。

每个角色的行为都会由emoji表示,并且会在系统中用一句话概括。比如某某正在写日记,就会用来表示。

有一天,Isabella和Tom相遇。他们聊起了有关竞选的话题。

要知道,角色之间能使用完整清晰的自然语言进行交流。并且每个角色都能感知到附近的其他角色,并能根据各自的性格和人物关系来自行决定,是擦肩而过还是开始攀谈。

Isabella:「我还在想我该选谁。但我和Sam Moore聊过竞选的事。你对他是什么看法?」

Tom:「讲实话,我不是很喜欢Sam。我觉得他有点脱离咱们的社区,不会为咱们的利益最大化而考虑。」

而出于试验的目的,研究人员还可以进行干预。不过这种干预不同于传统的输入剧本。而是在一些分支的走向上稍微施加一点力量,余下的部分还是靠AI自己发挥。

而具体到每一天的日常,每一个角色都会有自己的「routine」,这个「routine」是预设的。

以下就是药房小哥John Lin的一天。而至于每天会发生什么新鲜事,就是最有意思的部分了。

最后,再让我们看看情人节这天AI之间发生了什么有趣的互动吧。

在情人节这天,研究人员给了两个角色Isabella和Maria一人一条预设信息,告诉Isabella她要举办一场派对,并告诉Maria她喜欢Klaus。

然后,两个角色就开始自己玩自己的了。

Isabella在地图中溜达,看见人就邀请他们来自己的派对。

这其中就包括Maria。Maria肯定也不会错过这个机会和Klaus相处,于是她找到Klaus,邀请他一同前往Isabella的派对。

Isabella邀请完人也没闲着,去咖啡厅装饰了场地,还请来了Maria帮忙。

上面这张图展现了这些AI相互之间的关系,以及由派对引发的交互。

然后一群AI就快快乐乐地在下午五点开始派对了。

下面这张图则是详细地展开了这场派对的举办是怎么由AI自发引导的。涉及到了记忆的提取、从对环境的观察中进行的反思,以及决策。

左侧是Isabella观察到的环境内容,比如闲置的冰箱、床、架子、书桌、衣柜等等,然后根据环境和要举办派对的意图,做出了装饰、邀请、设计派对等等决策。

如此一来,整个过程就显得非常饱满了。

科幻照进现实?


以上的场景看似简单好玩,但是越发展越能展现出不一样的力量。

Pete在推特上表示,这个成果未来可以应用在很多方面。

比如说应用在VR世界,有了这种生成式智能体充当npc,想必像西部世界里设想的场景不再会是遥不可及的。

「在西部世界中,每一个NPC都有自己的思想,性格,计划,以及人际关系。甚至,更多的东西都是自主生成的。」而由谷歌和斯坦福的研究者们做的这个玩意儿,就是个迷你的Q版西部世界。

参考资料:https://twitter.com/nonmayorpete/status/1645355225157615616 https://www.reddit.com/r/MachineLearning/comments/12hluz1/r_generative_agents_interactive_simulacra_of/

相关文章
|
3天前
|
人工智能 自然语言处理 搜索推荐
【AGI】智能体简介及场景分析
【4月更文挑战第14天】AI时代,智能体的意义,使用场景及对未来的意义
|
10天前
|
人工智能 前端开发 决策智能
【AI Agent系列】【MetaGPT多智能体学习】5. 多智能体案例拆解 - 基于MetaGPT的智能体辩论(附完整代码)
【AI Agent系列】【MetaGPT多智能体学习】5. 多智能体案例拆解 - 基于MetaGPT的智能体辩论(附完整代码)
20 0
|
10天前
|
人工智能 决策智能
【AI Agent系列】【MetaGPT多智能体学习】6. 多智能体实战 - 基于MetaGPT实现游戏【你说我猜】(附完整代码)
【AI Agent系列】【MetaGPT多智能体学习】6. 多智能体实战 - 基于MetaGPT实现游戏【你说我猜】(附完整代码)
33 0
|
10天前
|
人工智能 决策智能
【AI Agent系列】【MetaGPT多智能体学习】3. 开发一个简单的多智能体系统,兼看MetaGPT多智能体运行机制
【AI Agent系列】【MetaGPT多智能体学习】3. 开发一个简单的多智能体系统,兼看MetaGPT多智能体运行机制
42 0
|
10天前
|
数据采集 人工智能 前端开发
【AI Agent系列】【MetaGPT多智能体学习】2. 重温单智能体开发 - 深入源码,理解单智能体运行框架
【AI Agent系列】【MetaGPT多智能体学习】2. 重温单智能体开发 - 深入源码,理解单智能体运行框架
39 1
|
26天前
|
人工智能 搜索推荐 安全
AI 智能体相关的 Prompt
AI 智能体相关的 Prompt
31 0
|
5月前
|
机器学习/深度学习 算法
在MDP环境下训练强化学习智能体
在MDP环境下训练强化学习智能体
43 0
|
9月前
|
机器学习/深度学习 算法 决策智能
多智能体强化学习(一) IQL、VDN、QMIX、QTRAN算法详解
多智能体强化学习(一) IQL、VDN、QMIX、QTRAN算法详解
1063 0
|
9月前
|
机器学习/深度学习 人工智能 算法
多智能体强化学习(二) MAPPO算法详解
多智能体强化学习(二) MAPPO算法详解
612 0
|
9月前
|
机器学习/深度学习 存储 人工智能
语言模型做先验,统一强化学习智能体,DeepMind选择走这条通用AI之路
语言模型做先验,统一强化学习智能体,DeepMind选择走这条通用AI之路
110 0