Google DeepMind团队公布玩游戏比人厉害的AI如何做出

简介:

Google DeepMind团队在《自然》杂志发表论文,公布玩游戏比人厉害的AI是如何做出来的。


电脑会玩游戏已经不算稀奇,比方说,一般人玩棋类游戏已经玩不过计算机了。但如果事先不告诉计算机应该怎么玩,而只是给它提供这三样东西:控制器、显示器、游戏得分,让它看着显示器的显示控制控制器,然后要求它尽可能得高分,那基本上大部分的 AI 就一筹莫展了。

0

所以,当 2013 年 12 月 DeepMind 的团队首次展现他们靠不断试错学习最后成为击败人类专业玩家的游戏高手AI时,许多在场的 AI 专家都感到有些震惊。这些 AI 靠着对游戏视频的观察来寻找出模式,然后操作控制器,并获得得分的反馈结果(高分奖励)。


在反馈中不断调整自己的控制,最后 AI 完全靠自学而不是编码学会了玩 49 种 Atari 视频游戏,其中 43 种游戏玩得比之前的 AI 都要好;并在 23 种游戏中击败了人类的职业玩家。这些游戏当中,简单的弹球和拳击游戏 AI 玩得最好,但是像经典的消砖块 Breakout 游戏也能玩得很好,甚至还学会了打开一条通道让球跑到后面去消掉砖块(参见下面视频,注意观察 AI 如何在游戏中改进自己的策略),这种技巧往往只有老练的玩家才会。许多研究人员 1 年后对他们如何做到仍感到困惑不已。不过现在他们不用困惑了,因为 DeepMind 团队现在已经在《自然》杂志上公布了自己的研究成果:Human-level control through deep reinforcement learning—通过深度强化学习实现人类水平的控制。

0

总的说来,DeepMind 的 AI 的设计核心是如何让计算机自行发现数据中存在的模式。其解决方案是深度神经网络与强化学习等方法的的结合。AI 并并不知道游戏规则,而是用深度神经网络来了解游戏的状态,找出哪一种行为能导致得分最高。尽管利用模拟神经网络来教电脑玩游戏(如军棋游戏)的方法已经使用了几十年,但是从未有人能像 DeepMind 团队那样以如此有用的方式结合到一起,智能系统普朗克学院的Bernhard Schölkopf主任称,其方案展现出了令人印象深刻的可适应性。


这一方面是得益于现在计算能力的提高使得 AI 可处理规模要大得多的数据集,要知道,观察 Atari 游戏相当于每秒处理 200 万像素的数据。另一方面则是得益于 DeepMind 结合了强化学习来训练 AI,而且是在高维度感觉输入中采用的端到端强化学习。相对于以往计算机会玩的游戏,如国际象棋等,这次计算机玩的游戏更接近现实世界的混沌状态。Google的智能设计师Demis Hassabis称,这是第一种能在一系列复杂任务当中与人类表现相当的算法。


那么 Google 会不会用这种 AI 来分析自己的大规模数据集呢?Hassabis 并没有给出任何肯定的说法,但称该系统对任何连续性决策任务都有用。如果我们把 Google 收集的用户数据比作像素,把广告收入比作得分的话,DeepMind 的 AI 系统一样也可以用在 Google 的核心广告业务。让 AI 去置放的广告,点击率越高就给它更高的分数,这样 AI 能够不断演进优化广告的投放算法。而伦敦大学金斯密斯学院的 Michael Cook 甚至给出了确切的数字,称 Google 已经在 7 款产品中采用了 DeepMind 的技术。其中会不会包括 Google 研发的自动汽车呢?也许用不了多久我们就能感受到有了那颗 DeepMind 支撑的产品的表现差异了。


原文发布时间为:2015-02-27

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
2月前
|
人工智能 自然语言处理 API
Google Gemma 模型服务:开放的生成式 AI 模型服务
Google Gemma 模型服务:开放的生成式 AI 模型服务
116 4
|
2月前
|
人工智能 安全 测试技术
Inflection AI团队仅70人,Pi每日聊天消息数超40亿
【2月更文挑战第24天】Inflection AI团队仅70人,Pi每日聊天消息数超40亿
46 3
Inflection AI团队仅70人,Pi每日聊天消息数超40亿
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
揭秘Google Gemini:AI界的多模态革命者与ChatGPT-4的较量
揭秘Google Gemini:AI界的多模态革命者与ChatGPT-4的较量
|
6月前
|
人工智能 程序员 测试技术
AI与Prompt:解锁软件开发团队的魔法咒语,在复杂任务上生成正确率更高的代码
AI与Prompt:解锁软件开发团队的魔法咒语,在复杂任务上生成正确率更高的代码
90 0
|
7月前
|
机器学习/深度学习 人工智能 Android开发
2023 Google 开发者大会 – AI 领域的技术更新
Google 开发者大会是 Google 面向开发者和科技爱好者展示最新产品和平台的年度盛会。2023 Google 开发者大会 (Google I/O Connect | China) 为开发者提供丰富的学习资源,实践操作和现场演示,提供与谷歌专家互动、与其他开发者交流的契机,助力开发提效,释放团队创造力,简化工作流程,以开放式集成解决方案为开发者效力,共同构建创新生态,开启美好未来。
361 2
|
11天前
|
程序员 Python
【🔥热闻速递】Google 裁撤 Python研发团队
Google近日决定解散其Python研发团队,原因是寻求更低劳动力成本,可能转向其他国家招聘。此举可能源于美国程序员薪资高昂,相比之下,中国工程师薪资更低且效率更高。谷歌CEO Sundar Pichai已将部分团队迁移至印度。这一决策引发对公司长期可持续性和人才保留问题的讨论,暗示谷歌正面临挑战。
28 5
|
19天前
|
人工智能 测试技术 决策智能
【AI Agent系列】【MetaGPT多智能体学习】4. 基于MetaGPT的Team组件开发你的第一个智能体团队
【AI Agent系列】【MetaGPT多智能体学习】4. 基于MetaGPT的Team组件开发你的第一个智能体团队
49 0
|
27天前
|
人工智能
史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录
【4月更文挑战第16天】研究人员结合吴方法和符号方法,开发的AI系统在国际数学奥林匹克几何问题测试中,成功解决27个问题,超过人类金牌得主。这项创新将吴方法(一种代数几何证明法)与经典符号方法融合,揭示了在自动化几何定理证明上的新潜力,但也面临证明可读性和软件实现局限等问题。
34 4
史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录
|
1月前
|
人工智能 前端开发 JavaScript
我们团队来了一位新同事,主动要求帮忙敲代码!欢迎 AI 001号
这位新同事不一般!下载量已经超过200万,每天生产的代码,有数百万行被程序员采纳,已经成长为中国目前最受欢迎的AI编程工具。
|
2月前
|
人工智能 算法 测试技术
脑洞大开丨让 AI 写代码,能做出什么样的项目?
AI 编程助手通义灵码可补全代码、写测试、调试和生成注释代码。现在推出全民体验活动,参与者有机会赢取 iPhone15、Switch 等大奖。