阿里开源强化学习研究平台Gym StarCraft

简介: 星际争霸一直是游戏玩家心目中即时战略类的经典之作,历时十多年而不衰。而如今它更成为深度强化学习、人工智能算法研究的一个主要平台和工具。因为其蕴含了多智能体协作、多任务学习、宏观策略规划等复杂问题,一旦取得部分突破和进展,对商业和社会发展都会带来极大影响。

星际争霸一直是游戏玩家心目中即时战略类的经典之作,历时十多年而不衰。而如今它更成为深度强化学习、人工智能算法研究的一个主要平台和工具。因为其蕴含了多智能体协作、多任务学习、宏观策略规划等复杂问题,一旦取得部分突破和进展,对商业和社会发展都会带来极大影响。如国外的DeepMind、Facebook等公司相继投入大量人力基于它进行通用人工智能的研究。

image


在星际争霸的AI研究中,一直以来缺乏完善的工具链和开发环境。今年年初Facebook公司发布的TorchCraft打通了星际和Torch之间的桥梁,但却不支持主流的Python开发语言和TensorFlow深度学习框架;早前OpenAI公司发布的Gym算法平台虽然支持众多游戏环境下的算法验证和对比测试,但却缺少对星际的支持。

阿里巴巴作为国内领先的大数据、云计算公司,对以强化学习为代表的人工智能技术密切关注并投入巨大。针对星际AI的这一现状,率先开发了一套专业易用的研究平台Gym StarCraft,并且已经开源。

在Gym StarCraft中,AI和强化学习研究者可以非常方便地使用Python语言来进行深度强化学习智能Agent的开发,它底层完成了对TorchCraft和OpenAI Gym的封装,支持基于TensorFlow和Keras等主流算法框架进行开发,仅需几十行代码即可完成一个基本的智能Agent的开发。同时,便于评测智能Agent的有效性,Gym StarCraft被集成在了OpenAI Gym这一主流的强化学习AI评测平台中,支持世界各地的星际AI研究者基于它去进行公平、快捷的效果评估,提供了一个人工智能的开放协作研究平台。

要了解更多该项目,请访问:https://github.com/deepcraft/gym-starcraft

原文链接

相关文章
|
2月前
|
人工智能 Cloud Native
2025 SECon+AgentX 大会 — AI 原生应用架构专场 | 限时报名开启
2025 SECon+AgentX 大会 — AI 原生应用架构专场 | 限时报名开启
236 1
|
机器学习/深度学习 人工智能 算法
深度强化学习中实验环境-开源平台框架汇总
深度强化学习中实验环境-开源平台框架汇总
814 0
|
机器学习/深度学习 人工智能 算法
【PyTorch深度强化学习】TD3算法(双延迟-确定策略梯度算法)的讲解及实战(超详细 附源码)
【PyTorch深度强化学习】TD3算法(双延迟-确定策略梯度算法)的讲解及实战(超详细 附源码)
3625 1
|
4月前
|
网络安全
wegame登录失败错误代码7610001该怎么解决?wegame错误代码7610001解决方法
WeGame错误代码7610001通常由防火墙或网络问题引起,可尝试删除WeGame相关防火墙规则后重新登录。此外,显卡驱动问题也可能导致此错误,建议使用驱动修复工具更新显卡驱动。本文还介绍了关闭防火墙及设置DirectX加速等解决方法,并提供相关软件下载链接,帮助你快速修复问题。
2285 3
wegame登录失败错误代码7610001该怎么解决?wegame错误代码7610001解决方法
|
11月前
|
SQL 关系型数据库 分布式数据库
PolarDB 开源基础教程系列 7.5 应用实践之 TPCH性能优化
PolarDB在复杂查询、大数据量计算与分析场景的测试和优化实践.
366 7
|
机器学习/深度学习 人工智能 自然语言处理
LLM 大模型学习必知必会系列(一):大模型基础知识篇
LLM 大模型学习必知必会系列(一):大模型基础知识篇
LLM 大模型学习必知必会系列(一):大模型基础知识篇
|
11月前
|
机器学习/深度学习 存储 人工智能
大模型综述
本文是一篇关于大模型的综述文章,旨在帮助读者快速了解并深入研究大模型的核心概念和技术细节。
1876 11
|
监控 Ubuntu 安全
debian或Ubuntu中开启ssh允许root远程ssh登录的方法
在Debian或Ubuntu系统中启用root用户的SSH远程登录需要编辑SSH配置文件、设置root密码并重启SSH服务。虽然这可以在某些情况下提供便利,但必须注意安全性,通过使用强密码、限制IP访问、使用SSH密钥认证等方法来保护服务器的安全。
5603 5
|
存储 索引 Python
字典是怎么实现的,它的底层结构长什么样子?
字典是怎么实现的,它的底层结构长什么样子?
407 2