如何让强化学习走进现实世界?DeepMind要用“控制套件”推动

简介:
本文来自AI新媒体量子位(QbitAI)

火遍全球的AlphaGo让我们知道了强化学习打游戏究竟有多6,这么强大的算法什么时候才能打破次元壁,走进现实、控制物理世界中的物体呢?

DeepMind已经开始往这方面努力。他们昨天发布的控制套件“DeepMind Control Suite”,就为设计和比较用来控制物理世界的强化学习算法开了个头。

就像ALE(Arcade Learning Environment)极大推动了用强化学习打电子游戏的研究一样,DeepMind希望他们的Control Suite也能推动用强化学习控制实体的研究,比如说先让模拟环境中的机器人学会行走、游泳、搬东西等等。

Control Suite设计了一组有着标准化结构、可解释奖励的连续控制任务,还为强化学习Agent提供一组性能测试指标

这些任务基于MoJoCo物理引擎,所用的语言是Python。DeepMind在GitHub上放出的源代码中,就包含基于MoJoCo的Python强化学习环境,以及为MoJoCo提供Python绑定的软件库。

59801837dc0cfbcce9245b274da284a90d02e0ae

如上图所示,Control Suite中的任务可以分为14个领域,也就是14类物理模型,上排从左到右分别是:

体操机器人Acrobot,(两节钟摆)、杯中小球、倒立摆、猎豹形机器人、手指、鱼、单足跳跃机器人,下排从左到右分别是人形机器人、机械手、钟摆、质点、形似两节手臂的Reacher、游泳机器人、步行者。

DeepMind还测试了A3C、DDPG和D4PG强化学习算法在这些任务上的表现,:

eb76924a677167d0c505517703f7b59d5349bf89

这些结果也是强化学习完成控制任务的基线数据。

DeepMind Control Suite似乎很受欢迎,截止量子位发稿,已经在GitHub上收获了300多个星标。

6039ba15db376ec998a8daf0a3efe14a454311c1

Twitter网友们也在热烈讨论这个Control Suite。不过,DeepMind官推为这个套件所选的配图,可谓骨骼清奇,被不少网友质疑:这是……最优跑步方式?

O(∩_∩)O 最后放出来,给大家来观赏一下:

3ed43cf67206c3662934e120091890968b863ab0

请勿模仿,请勿模仿,请勿模仿。

如果受伤了还怎么看下面的论文和代码呢~

论文:
https://arxiv.org/pdf/1801.00690.pdf

代码:
https://github.com/deepmind/dm_control

本文作者:夏乙
原文发布时间:2018-01-04
相关文章
|
9月前
|
机器学习/深度学习 传感器 人工智能
机器人技术的飞速进化:从想象到现实
机器人技术的快速发展正引领着人类走向未来,从工业制造到日常生活,机器人已经广泛应用。本文将探讨机器人技术的进化历程和多领域应用,展示机器人为我们带来的无限可能。
|
6月前
|
机器学习/深度学习 人工智能 算法
"揭秘机器学习背后的魔法:函数的力量如何塑造智能预测的奇迹之旅"
【8月更文挑战第16天】机器学习是人工智能的关键分支,通过算法和统计模型使计算机能从数据中学习并预测。本文介绍核心函数的应用及实现:线性回归预测连续值;逻辑回归处理二分类问题;决策树依据简单规则分类或预测;支持向量机寻找最优边界分类。使用Python的`scikit-learn`库实现这些函数,帮助理解机器学习算法的工作原理及其应用场景。
105 1
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习疆界:探索基本原理与算法,揭秘应用力量,展望未来发展与智能交互的新纪元
深度学习疆界:探索基本原理与算法,揭秘应用力量,展望未来发展与智能交互的新纪元
89 0
|
9月前
|
机器学习/深度学习 人工智能 算法
华为ICT——第八章:语音处理理论与实践02
华为ICT——第八章:语音处理理论与实践02
125 0
|
9月前
|
机器学习/深度学习 算法 语音技术
华为ICT——第八章:语音处理理论与实践01
华为ICT——第八章:语音处理理论与实践01
94 0
|
机器学习/深度学习 人工智能 自然语言处理
清华大学周伯文:ChatGPT火爆揭示新一代协同与交互智能的高度重要性
清华大学周伯文:ChatGPT火爆揭示新一代协同与交互智能的高度重要性
165 0
|
人工智能 搜索推荐 机器人
ChatGPT掀起波澜,人工智能最有可能取代的10种工作
ChatGPT掀起波澜,人工智能最有可能取代的10种工作
175 0
|
机器学习/深度学习 人工智能 编解码
忆海原识发布类脑计算平台,下一代AI突破口到来!(1)
忆海原识发布类脑计算平台,下一代AI突破口到来!
184 0
|
机器学习/深度学习 人工智能 算法
忆海原识发布类脑计算平台,下一代AI突破口到来!(2)
忆海原识发布类脑计算平台,下一代AI突破口到来!
173 0
|
机器学习/深度学习 人工智能 自动驾驶
忆海原识发布类脑计算平台,下一代AI突破口到来!
近日,在 2022 WAIC AI 开发者日上,忆海原识创始人兼 CEO 任化龙发表主题演讲《类脑计算的发展与关键技术》。演讲中,他夯实细致地介绍了类脑智能的特点以及与传统技术的对比,以及忆海原识自主研发的 Ocean 类脑计算平台。
503 0
忆海原识发布类脑计算平台,下一代AI突破口到来!

热门文章

最新文章