谷歌推出通用AI代理：能自动执行600多种动作，游玩复杂3D游戏-阿里云开发者社区

谷歌推出通用AI代理：能自动执行600多种动作，游玩复杂3D游戏

2024-03-25 103

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 谷歌DeepMind的SIMA项目旨在创建一个通用AI代理，该代理能在多种3D环境中执行复杂任务，通过语言指令与环境交互。目标是让AI理解并执行600多种动作，包括导航和建造等。使用多样化的3D环境训练，结合零基础训练和预训练模型，如SPARC和Phenaki，以增强语言理解和行动执行。评估方法多角度，包括人类评估，但也面临效率和成本挑战。项目注重伦理安全，但AI在复杂环境中的性能仍有提升空间。DeepMind将继续优化代理的鲁棒性，扩大研究范围，以推动通用人工智能的发展。

在人工智能领域，谷歌DeepMind的研究团队再次引起了业界的广泛关注。他们最新推出的SIMA（Scalable, Instructable, Multiworld Agent）项目，旨在打造一个能够在多种虚拟3D环境中执行复杂任务的通用AI代理。这一项目的核心理念是让AI代理通过语言指令与环境互动，实现类似于人类的感知和行为能力。

SIMA项目的目标非常宏大，它不仅要求AI代理能够理解和执行人类的语言指令，还要求它能够在各种3D环境中灵活运用这些指令，完成包括导航、操作物体、战斗、建造等在内的600多种动作。这意味着，SIMA代理不仅要具备高度的语言理解能力，还要能够将这些抽象的指令转化为具体的行动。

为了实现这一目标，DeepMind团队选择了多种3D环境进行训练，包括研究环境和商业视频游戏。这些环境的多样性和复杂性为AI代理提供了丰富的学习材料。通过在这些环境中的实践，SIMA代理能够学习到如何将语言指令与视觉信息相结合，从而在没有明确指令的情况下也能自主完成任务。

SIMA代理的架构设计也是项目成功的关键。它结合了从零开始训练的组件和预训练模型，如SPARC和Phenaki，这些模型在细粒度图像文本对齐和视频预测方面有着出色的表现。通过行为克隆和视频预测的进一步微调，SIMA代理能够更好地理解和响应语言指令。

在评估方面，DeepMind团队采用了多种评估方法，包括基于行动日志概率的评估、静态视觉输入评估、基于地面真实性的评估、光学字符识别（OCR）评估和人类评估。这些方法各有优势，但也存在效率、成本、准确性和覆盖范围的权衡。例如，人类评估虽然最为全面，但也最耗时和昂贵。

SIMA项目在伦理和安全方面也进行了深思熟虑。DeepMind团队遵循结构化的方法来开发负责任的模型，以识别、衡量和管理可预见的伦理和安全挑战。他们确保SIMA项目的社会利益大于风险，并且适当的风险缓解措施得到纳入。

尽管SIMA项目取得了初步的成功，但DeepMind团队清楚地认识到，AI代理在复杂环境中的表现仍有待提高。在商业视频游戏等更复杂的环境中的应用中，代理的表现相对较低，而在相对简单的研究环境中表现更好。这表明，AI代理在理解和执行复杂任务方面还有很大的提升空间。

未来，DeepMind团队计划通过扩展游戏和环境组合、提高代理的鲁棒性和可控性、利用日益高质量的预训练模型，以及开发更全面和严格控制的评估来推进SIMA项目。他们相信，通过这些努力，SIMA将成为一个理想的平台，用于在复杂环境中安全地进行关于语言和预训练模型的前沿研究，从而帮助解决通用人工智能的一个基本挑战。同时，他们的研究也有可能丰富未来基础模型的学习体验和部署环境，将大型语言模型的抽象能力具体化到具现环境中。

技术报告：https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf

谷歌推出通用AI代理：能自动执行600多种动作，游玩复杂3D游戏

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

谷歌推出通用AI代理：能自动执行600多种动作，游玩复杂3D游戏

热门文章

最新文章

相关课程

相关电子书

相关实验场景