深度强化学习中实验环境-开源平台框架汇总-阿里云开发者社区

深度强化学习中实验环境-开源平台框架汇总

2023-08-03 1025

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 深度强化学习中实验环境-开源平台框架汇总

本文汇总了常用的验证强化学习算法的开源环境平台。

当我们设计了一个强化学习算法之后，我们如何来验证算法的好坏呢？就像数据集一样，我们需要一个公认的平台来衡量这个算法。这样的一个平台，最基本的需要有仿真和渲染。

OpenAI Gym and Universe

业界最出名的莫过于Gym和Universe了。OpenAI Gym用于评估和比较强化学习算法的好坏。它的接口支持在任何框架下的算法，像TensorFlow, Theano, Keras这些都可以。

Gym库收集、解决了很多环境的测试过程中的问题，能够很好地使得你的强化学习算法得到很好地Work。并且含有游戏界面，能够帮助你去写通用性更强的算法。业界现在主流的就是这个环境，如果有还没有了解过的，需要配置的同学，可以参考我之前写的一篇详细的安装使用教程：强化学习环境-Gym安装到使用入门

在各大顶会上经常会看到用于连续控制物理引擎的MuJoCo但这个收费的。

RoboSchool

作为MuJoCo实现的替代品，OpenAI开发了基于Bullet物理引擎的Roboschool 。它提供了OpenAI Gym形式的接口用于模拟机器人控制。目前包含了12个环境。其中除了传统的类似MuJoCo的场景，还有交互控制，及多智能体控制场景。

GitHub链接：https://github.com/openai/roboschool
官网链接：https://openai.com/blog/roboschool/

Gym中还有用于机械臂的抓取和灵巧手的机械手、机械臂环境Robotics:

GitHub链接：https://github.com/openai/gym
官网链接：http://gym.openai.com/

OpenAI Universe相当于是OpenAI Gym的一个扩展，它所能提供的环境更加的复杂，有即时战略游戏的味道，对决策时间有一定的要求。

Universe的发布也算是业界福音，任何程序都可以被转换成一个Gym的环境。Universe 通过自动启动程序在一个VNC远程桌上进行工作，所以它不需要对程序内部、源码或者bot API的特别访问。环境被打包Docker镜像，安装使用将更加方便。

GitHub链接：https://github.com/openai/universe
官网链接：https://openai.com/blog/universe/

DeepMind Lab

DeepMind Lab是一个第一人称3D游戏平台，它以丰富的科幻视觉来呈现场景。可用的操作能让智能体环顾四周，并以3D的形式移动。示例任务包括收集水果、走迷宫、穿越危险的通道且要避免从悬崖上坠落、使用发射台在平台间移动、玩激光笔、以及快速学习并记住随机生成的环境。DeepMind Lab已经成为DeepMind内部的一个主要研究平台，DeepMind Lab同时拥有更丰富的视觉效果和更自然的物理效果。

官网链接：https://deepmind.com/research/publications/deepmind-lab
GitHub链接：https://github.com/deepmind/lab

Project Malmo

Malmo由微软剑桥研究员Katja Hofmann带领开发，是Microsoft基于Minecraft(我的世界)开发的一个人工智能实验和研究平台。这个平台也还用于第一届协同AI挑战赛。

Malmo是用于多智能体强化学习算法的开源平台，要求智能体之间相互合作，将协同AI做到极致。并且研究人员还可以加速《我的世界》中的时钟，加快试验速度。

GitHub链接：https://github.com/crowdAI/marLo
协同AI挑战赛官网：https://www.microsoft.com/en-us/research/academic-program/collaborative-ai-challenge/

ViZDoom

ViZDoom提供了用AI玩毁灭战士游戏的环境(一人称射击类游戏)。它提供的是一个多智能体竞争博弈的一个环境，用于测试算法的好坏。

GitHub链接：https://github.com/mwydmuch/ViZDoom

我的微信公众号名称：深度学习先进智能决策

微信公众号ID：MultiAgent1024

公众号介绍：主要研究深度学习、强化学习、机器博弈等相关内容！期待您的关注，欢迎一起学习交流进步！

深度强化学习中实验环境-开源平台框架汇总

OpenAI Gym and Universe

RoboSchool

DeepMind Lab

Project Malmo

ViZDoom

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

深度强化学习中实验环境-开源平台框架汇总

OpenAI Gym and Universe

RoboSchool

DeepMind Lab

Project Malmo

ViZDoom

热门文章

最新文章

相关电子书