支持Python 3.10,OpenAI强化学习工具包Gym迎来史上最大更新

简介: 支持Python 3.10,OpenAI强化学习工具包Gym迎来史上最大更新

OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已经成为了领域标准。

目前,在 Gym 的项目主页,Star 量已经达到了 26.6k。


项目地址:https://github.com/openai/gym

近日,Gym 迎来了迄今为止最大的更新,包括 API 变化、环境变化和其他变化。

API 变化

首先是 API 变化,包括如下:

  • env.reset 接受 3 个新的参数(options - 对于无再次初始化环境时控制课程学习等操作有用;seed - 未来环境 seed 可以传递到 reset 参数。老的 .seed() 方法被弃用,但考虑到向后兼容,该方法在 Gym 1.0 发布之前仍继续如常工作;infos - 当设置为 True,reset 将返回 obs, info。当前这种做法默认为 False,但将变成 Gym 1.0 版本的默认行为);
  • 环境名称在注册期间不再需要一个版本,并将智能推荐类似名称;
  • Vector 环境支持 info 中的 terminal_observation 并支持批处理操作空间。


环境变化

  • blackjack 和 frozen lake 示例环境现在使用 PyGame 进行了更好的图形渲染;
  • 机器人环境已移动到 gym-robotics 包中;
  • bipedal walker 和 lunar lander 环境现在被合并称为一类;
  • Atari 环境现在使用标准种子 API 了;
  • 修复了 car_racing box2d 环境中的大错误修复,碰撞版本;
  • 重构了所有 box2d 和 classic_control 环境,以使用 PyGame 而不是 Pyglet。因为 pyglet 的问题一直是 gym 项目生命周期中最常见的 GitHub 问题来源之一。


其他变化

  • 移除 DiscreteEnv 类,内置环境将不再使用;
  • 增加了大数类型提示;
  • 支持 Python 3.10 版;
  • 大量额外的代码重构、清理、错误消息改进和小错误修复;
  • 所有环境文件的描述文件现在都有了明显改进。


相关文章
|
4天前
|
Python 缓存 开发者
Python中的装饰器:优雅而强大的代码增强工具
在Python编程中,装饰器是一种强大的工具,它允许开发者在不改变原有代码结构的情况下,增加额外的功能。本文将深入探讨Python中装饰器的概念、用法和实际应用,展示其在代码优化和增强方面的威力。
|
5天前
|
Python
Python文件的异常、模块与包
Python文件的异常、模块与包
11 3
3个常用的Python性能分析工具及其使用方法
以下是几个常用的性能分析工具及其使用方法和常用命令:
|
11天前
|
缓存 监控 数据安全/隐私保护
探索Python中的装饰器:一种强大的元编程工具
在Python编程中,装饰器是一个强大而优雅的元编程工具,它允许我们在不修改原有函数或类代码的情况下,为其添加新的功能或修改其行为。本文将带您深入了解Python装饰器的概念、工作原理及其在实际编程中的应用,通过示例演示如何创建和使用装饰器,并探讨其在代码复用、性能监控和日志记录等方面的强大作用。
|
12天前
|
Python
Python中的模块与包——深入理解与应用
Python中的模块与包——深入理解与应用
|
15天前
|
Python
python(pip)包/模块:如何离线安装?
python(pip)包/模块:如何离线安装?
11 0
|
19天前
|
关系型数据库 Java 分布式数据库
实时计算 Flink版操作报错合集之在使用 Python UDF 时遇到 requests 包的导入问题,提示 OpenSSL 版本不兼容如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
35 5
|
19天前
|
程序员 开发者 Python
Python中的装饰器:优雅而强大的函数修饰工具
在Python编程中,装饰器是一种强大的工具,它可以简洁地实现函数的增强、扩展和重用。本文将深入探讨Python中装饰器的工作原理、常见应用场景以及如何自定义装饰器,帮助读者更好地理解和运用这一重要的编程概念。
|
19天前
|
SQL 物联网 关系型数据库
sqlmap工具的使用 (超详细附工具版)_python sqlmap
sqlmap工具的使用 (超详细附工具版)_python sqlmap
|
22天前
|
Python Windows
Python分发包安装pip3
Python分发包安装pip3
11 0