如何让强化学习走进现实世界?DeepMind要用“控制套件”推动

简介:
本文来自AI新媒体量子位(QbitAI)

火遍全球的AlphaGo让我们知道了强化学习打游戏究竟有多6,这么强大的算法什么时候才能打破次元壁,走进现实、控制物理世界中的物体呢?

DeepMind已经开始往这方面努力。他们昨天发布的控制套件“DeepMind Control Suite”,就为设计和比较用来控制物理世界的强化学习算法开了个头。

就像ALE(Arcade Learning Environment)极大推动了用强化学习打电子游戏的研究一样,DeepMind希望他们的Control Suite也能推动用强化学习控制实体的研究,比如说先让模拟环境中的机器人学会行走、游泳、搬东西等等。

Control Suite设计了一组有着标准化结构、可解释奖励的连续控制任务,还为强化学习Agent提供一组性能测试指标

这些任务基于MoJoCo物理引擎,所用的语言是Python。DeepMind在GitHub上放出的源代码中,就包含基于MoJoCo的Python强化学习环境,以及为MoJoCo提供Python绑定的软件库。

59801837dc0cfbcce9245b274da284a90d02e0ae

如上图所示,Control Suite中的任务可以分为14个领域,也就是14类物理模型,上排从左到右分别是:

体操机器人Acrobot,(两节钟摆)、杯中小球、倒立摆、猎豹形机器人、手指、鱼、单足跳跃机器人,下排从左到右分别是人形机器人、机械手、钟摆、质点、形似两节手臂的Reacher、游泳机器人、步行者。

DeepMind还测试了A3C、DDPG和D4PG强化学习算法在这些任务上的表现,:

eb76924a677167d0c505517703f7b59d5349bf89

这些结果也是强化学习完成控制任务的基线数据。

DeepMind Control Suite似乎很受欢迎,截止量子位发稿,已经在GitHub上收获了300多个星标。

6039ba15db376ec998a8daf0a3efe14a454311c1

Twitter网友们也在热烈讨论这个Control Suite。不过,DeepMind官推为这个套件所选的配图,可谓骨骼清奇,被不少网友质疑:这是……最优跑步方式?

O(∩_∩)O 最后放出来,给大家来观赏一下:

3ed43cf67206c3662934e120091890968b863ab0

请勿模仿,请勿模仿,请勿模仿。

如果受伤了还怎么看下面的论文和代码呢~

论文:
https://arxiv.org/pdf/1801.00690.pdf

代码:
https://github.com/deepmind/dm_control

本文作者:夏乙
原文发布时间:2018-01-04
相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习疆界:探索基本原理与算法,揭秘应用力量,展望未来发展与智能交互的新纪元
深度学习疆界:探索基本原理与算法,揭秘应用力量,展望未来发展与智能交互的新纪元
35 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
谷歌AI方向巨变:新研究要闭源,让OpenAI没得看
谷歌AI方向巨变:新研究要闭源,让OpenAI没得看
|
11月前
|
机器学习/深度学习 人工智能 监控
OpenAI发布通用人工智能路线图:AGI比想象中来得更快
OpenAI发布通用人工智能路线图:AGI比想象中来得更快
192 0
|
11月前
|
人工智能 机器人 数据库
人类不应惧怕被人工智能自动化取代的原因
人类不应惧怕被人工智能自动化取代的原因
|
11月前
|
机器学习/深度学习 存储 人工智能
ChatGPT掀智力革命!OpenAI发布AGI路线图,最终通向超级智能世界
ChatGPT掀智力革命!OpenAI发布AGI路线图,最终通向超级智能世界
165 0
|
人工智能 算法 测试技术
游戏是人工智能研究的理想场景
游戏是人工智能研究的理想场景
95 0
游戏是人工智能研究的理想场景
|
人工智能 算法 机器人
用算法模拟演变机器人“进化”!MIT开发新平台,还能优化机器人身体和大脑,已开源
用算法模拟演变机器人“进化”!MIT开发新平台,还能优化机器人身体和大脑,已开源
115 0
用算法模拟演变机器人“进化”!MIT开发新平台,还能优化机器人身体和大脑,已开源
|
存储 人工智能 自动驾驶
AI化学家诞生!1天可做500个实验,自主开发新材料,实验室劳力们,颤抖吧
近日,来自北卡罗莱纳州立大学和布法罗大学的研究人员开发了一项名为“人工化学家”的技术,该技术结合了人工智能(AI)和执行化学反应的自动化系统,以加速研发和生产商业所需的新化学材料。
|
机器学习/深度学习 人工智能 自动驾驶
吴恩达:模拟人脑,未来AI执行精神层面任务有望快过人类!
AI在未来如何实现真正的“智能”?这个问题似乎遭遇瓶颈。目前深度学习对人类大脑的模拟仍然处于初级阶段,是否应该沿这条路继续走下去?吴恩达认为,通过深度学习模拟大脑,未来的AI能够比人类更快地完成精神层面的任务。也有研究人员认为,应从大自然中寻找灵感,让AI建立关于世界的“心理模型”。
1260 0