爆火论文打造《西部世界》雏形：25个AI智能体，在虚拟小镇自由成长（2）-阿里云开发者社区

爆火论文打造《西部世界》雏形：25个AI智能体，在虚拟小镇自由成长（2）

2023-05-25 280

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 爆火论文打造《西部世界》雏形：25个AI智能体，在虚拟小镇自由成长

架构

Generative Agents 需要一个框架来指导其在开放世界中的行为，旨在让 Generative Agents 能够与其他智能体进行交互并对环境变化做出反应。

Generative Agents 将其当前环境和过去的经验作为输入，生成行为作为输出。Generative Agents 的架构将大型语言模型和合成与检索相关信息的机制结合到一起，以调节语言模型的输出。

如果没有合成与检索机制，大型语言模型可以输出行为，但 Generative Agents 可能不会根据智能体过去的经验做出反应，以至于无法做出重要的推理，也可能无法保持长期的连贯性。即使使用当前性能最好的模型（例如 GPT-4），长期规划和连贯性方面的挑战仍然存在。

由于 Generative Agents 会产生大量必须保留的事件和记忆流（memory stream），因此其架构的核心挑战是确保在需要时检索和合成智能体记忆中最相关的部分。

Generative Agents 的架构中心是记忆流 —— 一个全面记录智能体经验的数据库。智能体会从记忆流中检索相关记录，以规划智能体的动作行为并对环境做出适当反应，并且每次行为都会被记录以递归合成更高级别的行为指导。Generative Agents 架构中所有的内容都被记录下来并以自然语言描述的形式来进行推理，从而使智能体能够利用大型语言模型的推理功能。

当前，该研究实现了使用 ChatGPT 的 gpt3.5-turbo 版本。研究团队预计 Generative Agents 的架构基础 —— 记忆、规划和反思 —— 可能会保持不变。较新的语言模型（例如 GPT-4）拥有更好的表达能力和性能，这会进一步扩展 Generative Agents。

记忆与检索

Generative Agents 的架构实现了一个检索功能，该功能将智能体的当前情况作为输入并返回记忆流的一个子集以传递给语言模型。检索功能有多种可能的实现方式，具体取决于智能体在决定如何行动时考虑的重要因素。

反思

该研究还引入了第二种类型的记忆，称为「反思」。反思是由智能体生成的更高层次、更抽象的思想。反思是周期性产生的，在该研究中，只有当智能体对最近事件的重要性分数总和超过某个阈值，智能体才会开始反思。