OpenAI对强化学习环境的汇总

简介: OpenAI对强化学习环境的汇总

这次OpenAI官方汇总了一些第三方强化学习环境,其网址为:

https://www.gymlibrary.ml/pages/third_party_environments/

主要包括以下几类

  1. 视频游戏类
  2. 棋牌类游戏
  3. 机器人环境
  4. 自动驾驶和交通控制类
  5. 其它一些

这个覆盖内容比较广,从游戏,机器人,自动驾驶,信号灯控制到能源控制,推荐系统等等都有涉及。

废话不多说,赶紧上车!

视频游戏类

飞行小鸟

gym-derk

这是一个3V3的MOBA类游戏,支持几百个实例并行计算,但是是收费的。

MineRL

迷你世界的游戏封装,主要聚焦在稀疏奖励部分。

Procgen

16个环境,主要聚焦在强化学习泛化学习技巧

Slime Volleyball

1V1博弈类视频游戏

ML-Agents

Unity写地游戏环境,提供2D,3D,AR、VR类游戏。

棋牌类

abalone

两个玩家的abstract strategy类游戏:

spoof

三币游戏,两个玩家,非完美信息,零和博弈类问题:

象棋游戏

中国象棋游戏:

魔方环境

提供了多种魔方环境:

围棋

机器人环境

GymFC

GymFC是一个用于合成神经飞行控制器的模块化框架。该架构集成了数字孪生概念,以提供训练有素的策略向硬件的无缝转移。OpenAI环境已被用于为世界上第一个开源神经网络飞行控制固件Neuroflight生成策略。

gym-gazebo

在gazebo种做的一些强化学习控制环境:

等等这些做了有个七八个。

goddard

一个模拟经典最优控制问题的环境,其中垂直上升的火箭的推力应被确定为使其达到最大可能的高度,同时受到不同的空气动力阻力、重力和质量的影响。

jiminy

gym-jiminy提出了最初的OpenAI机器人健身房的扩展,使用Jiminy,这是一个极其快速和轻量级的多关节系统模拟器,使用Pinocchio进行物理评估和Meshcat进行基于网络的3D渲染。

miniworld

MiniWorld是一个简约的3D室内环境模拟器,用于强化学习和机器人学研究。它可以用来模拟有房间、门、走廊和各种物体的环境(例如:办公室和家庭环境、迷宫)。MiniWorld可以被看作是VizDoom或DMLab的一个更简单的替代品。它是100%用Python编写的,旨在让学生容易修改或扩展。

pybullet-drones

多智能体四旋翼环境:

- https://github.com/utiasDSL/gym-pybullet-drones

火星探险家

火星探险家是一个与openai-gym兼容的环境,它的设计和开发是为了弥补强大的深度强化学习方法和未知地形的探索/覆盖问题之间的差距。

机械臂抓取环境

基于PyBullet开发的机械臂抓取环境:

robo-gym

一个开源的支持分布式从仿真到真实环境的工具:

OffWorld Gym

一个仿真实环境做的环境:

自动驾驶和交通控制类

gym-carla

基于carla的gym第三方环境:

Gym-Duckietown

一个Duckietown宇宙的模拟器,用纯Python/OpenGL(Pyglet)编写。它把你的代理,一个Duckiebot,放在Duckietown的一个实例中:一个有转弯、交叉口、障碍物、Duckie行人和其他Duckiebot的道路循环。这可能是一个相当繁忙的地方

电机类环境

highway-env

一个用于自主驾驶的行为规划的环境,强调高水平的感知和决策,而不是低水平的感应和控制。该任务的难度在于理解与其他司机的社会互动,因为他们的行为是不确定的。提出了几个场景,如高速公路、合并、交叉口和环岛。

longicontrol

一个用于电动汽车随机纵向控制的环境。它旨在成为自主驾驶领域内一个连续的现实世界问题的描述性和可理解的例子。

交通信号灯控制环境

其它一些

Gridworld

网格环境。

gym-adserver

一个实现典型的多臂强盗场景的环境,其中广告服务器必须选择最好的广告来显示在网页上。其中包括一些实例代理。随机、epsilon-Greedy、Softmax和UCB1。

gym-maze

2D寻路环境:

用于推荐系统中的环境

对于数学问题求解的环境

解决NLP问题的环境

obstacle-tower-env

障碍塔是一个按程序生成的环境,由多个楼层组成,由学习型代理解决。它旨在测试学习代理在计算机视觉、运动技能、高级规划和概括方面的能力。它将平台式游戏与谜题和规划问题结合起来,关键是随着代理的进步,难度也在增加。

电网能源优化

稳定控制类

虚拟淘宝

相关文章
|
传感器 自动驾驶 算法
【OpenAI】Python:基于 Gym-CarRacing 的自动驾驶项目(1) | 前置知识介绍 | 项目环境准备 | 手把手带你一步步实现
【OpenAI】Python:基于 Gym-CarRacing 的自动驾驶项目(1) | 前置知识介绍 | 项目环境准备 | 手把手带你一步步实现
832 0
|
7月前
|
机器学习/深度学习 算法 算法框架/工具
OpenAI Gym 中级教程——深入强化学习算法
OpenAI Gym 中级教程——深入强化学习算法
355 6
|
7月前
|
机器学习/深度学习 存储 算法
OpenAI Gym 中级教程——强化学习实践项目
OpenAI Gym 中级教程——强化学习实践项目
143 1
|
7月前
|
机器学习/深度学习 开发者 Python
OpenAI Gym高级教程——领域自适应强化学习
OpenAI Gym高级教程——领域自适应强化学习
334 0
|
7月前
|
机器学习/深度学习 监控 算法
OpenAI Gym 高级教程——深度强化学习库的高级用法
OpenAI Gym 高级教程——深度强化学习库的高级用法
533 0
|
7月前
|
机器学习/深度学习 算法 测试技术
OpenAI Gym 中级教程——环境定制与创建
OpenAI Gym 中级教程——环境定制与创建
269 0
|
机器学习/深度学习 算法 机器人
支持Python 3.10,OpenAI强化学习工具包Gym迎来史上最大更新
支持Python 3.10,OpenAI强化学习工具包Gym迎来史上最大更新
336 0
|
机器学习/深度学习 人工智能 算法
OpenAI Gym 经典控制环境介绍——CartPole(倒立摆)
OpenAI Gym 经典控制环境介绍——CartPole(倒立摆)
1010 0
|
机器学习/深度学习 人工智能 数据可视化
强化学习怎样在探索和利用之间找到平衡?OpenAI 推出了大型多智能体游戏环境 Neural MMO
近日,OpenAI 推出了Neural MMO 大型多智能体在线游戏环境,研究边界开放、规模巨大环境下的多智能体强化学习技术。看看他们都做了些什么吧!
561 0
|
机器学习/深度学习 人工智能 算法
动态 | 从零开始快速入门深度强化学习,OpenAI 发布学习资源 Spinning Up
资源包含了易懂的深度强化学习代码示例、习题、文档和教程。
619 0