深度强化学习中实验环境-开源平台框架汇总

简介: 深度强化学习中实验环境-开源平台框架汇总

本文汇总了常用的验证强化学习算法的开源环境平台。

  当我们设计了一个强化学习算法之后,我们如何来验证算法的好坏呢?就像数据集一样,我们需要一个公认的平台来衡量这个算法。这样的一个平台,最基本的需要有仿真和渲染。

OpenAI Gym and Universe

  业界最出名的莫过于GymUniverse了。OpenAI Gym用于评估和比较强化学习算法的好坏。它的接口支持在任何框架下的算法,像TensorFlow, Theano, Keras这些都可以。

  Gym库收集、解决了很多环境的测试过程中的问题,能够很好地使得你的强化学习算法得到很好地Work。并且含有游戏界面,能够帮助你去写通用性更强的算法。业界现在主流的就是这个环境,如果有还没有了解过的,需要配置的同学,可以参考我之前写的一篇详细的安装使用教程:强化学习环境-Gym安装到使用入门

  在各大顶会上经常会看到用于连续控制物理引擎的MuJoCo但这个收费的。

RoboSchool

  作为MuJoCo实现的替代品,OpenAI开发了基于Bullet物理引擎的Roboschool 。它提供了OpenAI Gym形式的接口用于模拟机器人控制。目前包含了12个环境。其中除了传统的类似MuJoCo的场景,还有交互控制,及多智能体控制场景。

  Gym中还有用于机械臂的抓取和灵巧手的机械手、机械臂环境Robotics:

  OpenAI Universe相当于是OpenAI Gym的一个扩展,它所能提供的环境更加的复杂,有即时战略游戏的味道,对决策时间有一定的要求。

  Universe的发布也算是业界福音,任何程序都可以被转换成一个Gym的环境。Universe 通过自动启动程序在一个VNC远程桌上进行工作,所以它不需要对程序内部、源码或者bot API的特别访问。环境被打包Docker镜像,安装使用将更加方便。

DeepMind Lab

  DeepMind Lab是一个第一人称3D游戏平台,它以丰富的科幻视觉来呈现场景。可用的操作能让智能体环顾四周,并以3D的形式移动。示例任务包括收集水果、走迷宫、穿越危险的通道且要避免从悬崖上坠落、使用发射台在平台间移动、玩激光笔、以及快速学习并记住随机生成的环境。DeepMind Lab已经成为DeepMind内部的一个主要研究平台,DeepMind Lab同时拥有更丰富的视觉效果和更自然的物理效果。

Project Malmo

  Malmo由微软剑桥研究员Katja Hofmann带领开发,是Microsoft基于Minecraft(我的世界)开发的一个人工智能实验和研究平台。这个平台也还用于第一届协同AI挑战赛

  Malmo是用于多智能体强化学习算法的开源平台,要求智能体之间相互合作,将协同AI做到极致。并且研究人员还可以加速《我的世界》中的时钟,加快试验速度。

ViZDoom

  ViZDoom提供了用AI玩毁灭战士游戏的环境(一人称射击类游戏)。它提供的是一个多智能体竞争博弈的一个环境,用于测试算法的好坏。

我的微信公众号名称:深度学习先进智能决策

微信公众号ID:MultiAgent1024

公众号介绍:主要研究深度学习、强化学习、机器博弈等相关内容!期待您的关注,欢迎一起学习交流进步!

相关文章
|
7月前
|
人工智能 物联网 PyTorch
SCEdit:轻量级高效可控的AI图像生成微调框架(附魔搭社区训练实践教程)
SCEdit是一个高效的生成式微调框架,由阿里巴巴通义实验室基础视觉智能团队所提出。
|
4月前
|
机器学习/深度学习 数据处理 定位技术
构建您的首个机器学习项目:从理论到实践
【8月更文挑战第28天】本文旨在为初学者提供一个简明的指南,通过介绍一个基础的机器学习项目——预测房价——来揭示机器学习的神秘面纱。我们将从数据收集开始,逐步深入到数据处理、模型选择、训练和评估等环节。通过实际操作,你将学会如何利用Python及其强大的科学计算库来实现自己的机器学习模型。无论你是编程新手还是有一定经验的开发者,这篇文章都将为你打开一扇通往机器学习世界的大门。
|
5月前
|
机器学习/深度学习 自然语言处理 算法
大模型技术基础
【7月更文挑战第26天】大模型技术基础
118 6
|
7月前
|
机器学习/深度学习 数据采集 算法
构建高效机器学习模型的策略与实践
【5月更文挑战第29天】 在数据驱动的时代,机器学习模型已成为解决复杂问题的关键工具。本文旨在探讨如何构建一个高效的机器学习模型,包括数据处理、算法选择、模型训练和评估等关键步骤。我们将通过实例展示如何应用这些策略来优化模型性能,并讨论在实际应用中可能遇到的挑战和解决方案。
|
7月前
|
机器学习/深度学习 数据采集 人工智能
构建高效机器学习模型的实践指南
【5月更文挑战第21天】 在数据驱动的时代,构建一个高效的机器学习模型已经成为众多行业提升决策质量、优化业务流程的关键。本文将分享一系列实用的技术和策略,帮助读者提高其机器学习项目的性能与效率。我们将探讨数据预处理的重要性、特征工程的技巧、选择合适的算法框架、调参的艺术以及模型评估和验证方法。通过阅读本文,你将获得一套综合性的方法论,以指导你在实际工作中构建出更加健壮、准确的机器学习模型。
|
机器学习/深度学习 存储 文字识别
图解来啦!机器学习工业部署最佳实践!10分钟上手机器学习部署与大规模扩展 ⛵
如何快速部署机器学习模型?本文是机器学习工业部署的 best practice(最佳实践)!详细讲解了如何操作机器学习开源框架 BentoML,帮助研发团队轻松打包机器学习模型,并重现该模型以用于生产。
1768 4
图解来啦!机器学习工业部署最佳实践!10分钟上手机器学习部署与大规模扩展 ⛵
|
7月前
|
机器学习/深度学习 算法 关系型数据库
【PyTorch深度强化学习】DDPG算法的讲解及实战(超详细 附源码)
【PyTorch深度强化学习】DDPG算法的讲解及实战(超详细 附源码)
2211 1
|
机器学习/深度学习
基于分布式平台的机器学习模型训练以及上线部署方案总结
基于分布式平台的机器学习模型训练以及上线部署方案总结
552 0
|
机器学习/深度学习 自然语言处理 算法
系统回顾深度强化学习预训练,在线、离线等研究这一篇就够了
系统回顾深度强化学习预训练,在线、离线等研究这一篇就够了
188 0
|
机器学习/深度学习 数据采集 人工智能
whylogs工具库的工业实践!机器学习模型流程与效果监控 ⛵
本文讲解如何使用whylogs工具库,构建详细的AI日志平台,并监控机器学习模型的流程与效果。核心操作包括:环境配置、新建项目并获取ID、获取组织ID和访问Key、将配置文件写入WhyLabs、监控模型性能指标。
915 2
whylogs工具库的工业实践!机器学习模型流程与效果监控 ⛵
下一篇
DataWorks