中科院自动化所拿下星际争霸AI竞赛第四名,顺便发布了一个训练AI“大局观”的数据集

简介: 上周日,互动数字娱乐AI大会(AIIDE)2017中的星际争霸AI竞赛落下帷幕。这一竞赛是即时战略(RTS)游戏AI比赛中最重要的比赛之一,暴雪、DeepMind和Facebook人工智能研究院等机构也有赞助。

上周日,互动数字娱乐AI大会(AIIDE)2017中的星际争霸AI竞赛落下帷幕。这一竞赛是即时战略(RTS)游戏AI比赛中最重要的比赛之一,暴雪、DeepMind和Facebook人工智能研究院等机构也有赞助。两周的车轮战中共进行了41580场1v1比赛,28个参赛AI中每两个之间也平均比赛了110场。

DeepMind 和 Facebook 近两年在星际争霸AI研发上动作频频,Facebook 也拿出名为 CherryPi 的机器学习AI亲自参加了这场比赛,但只以69%的胜率拿到第6名。面对这样的战绩,多家外媒不免对 Facebook 发出了“雷声大雨点小”的嘲笑,不过机器学习在RTS游戏中的探索毕竟只是刚刚开始,大可不必心急。

比赛冠军是一位独立参加的星际争霸爱好者,来自澳大利亚的程序员Chris Coxe,依靠手工编码、基于预定义规则和情境判断的AI获得了最高胜率83%,从而获得冠军;不仅如此,排名前三的AI都是由独立参赛的星际争霸爱好者开发的,大多数排名靠前的个人参赛AI也都是和Chris Coxe类似的手工编码、基于规则的AI。

同时雷锋网 AI 科技评论发现,也有多个来自中国的AI参加了这次比赛,除了个人名义参加的Sijia Xu和他的AI“Overkill”之外,中科院自动化研究所更是有三支队伍参赛,复杂系统管理与控制国家重点实验室有两支,一支是在读博士生朱圆恒、赵冬斌研究员的团队和他们的AI“Juno”,另一支是唐振涛团队,他们的AI名为“killall”;还有一支团队来自智能感知与计算研究中心,他们的AI“cpac”首次参赛就以71%的胜率拿下了第4名。

智能感知与计算研究中心“cpac”团队共有13名成员,开发这个 AI 用了几个月的时间,其中有新的游戏策略,也融合了部分机器学习功能。根据他们介绍,他们训练了一个多层感知网络用于在生产队列为空的时候造兵。

在这个 AI 的开发过程中,他们还一并发布了一个新的数据集 MSC(Macro-management in StarCraft),论文署名为在读博士生武慧凯、副研究员张俊格、研究员黄凯奇。

中科院自动化所拿下星际争霸AI竞赛第四名,顺便发布了一个训练AI“大局观”的数据集

MSC 基于暴雪今年开放的 SC2LE 平台,作者们在论文中表示这个平台的好处是有目前为止最大的replay数据集、这些replay的质量更高格式更标准,而且 SC2LE 还有官方的支持和积极的更新。

MSC 数据集的目标是提供预定义的、根据特征分割过的replay,用于游戏中宏观操作(比赛策略&“大局观”,Macro-management)的训练和评估。SC2LE中现有的replay虽然数量很多,但是没办法直接用来学习和测试;MSC则把replay过滤、解析、采样、提取操作特征,并形成训练、验证、测试三个数据集,就可以供研究人员方便地训练模型,数据集自身也就成为了公开、标准的模型对比手段。

中科院自动化所拿下星际争霸AI竞赛第四名,顺便发布了一个训练AI“大局观”的数据集

MSC基于 CS2LE 的80万场replay中已经公开的约6万4千场,按照上图中的流程进行处理,形成三个数据集。在预处理中剔除了过短、APM(每分钟操作数)过低以及选手的MMR(比赛积分)过低的比赛。

除了数据集之外,论文中也一并提出了一个基准模型,展示了在全局局面评估和单位建造预测任务中的表现;其它游戏策略、序列建模、不确定性建模、不平衡数据集学习、强化学习、规划和树搜索等RTS游戏中常出现的子任务也可以从这个数据集中受益。



本文作者:杨晓凡
本文转自雷锋网禁止二次转载, 原文链接
目录
打赏
0
0
0
0
26198
分享
相关文章
【科普向】我们所说的AI模型训练到底在训练什么?
人工智能(AI)模型训练类似于厨师通过反复实践来掌握烹饪技巧。它通过大量数据输入,自动优化内部参数(如神经网络中的权重和偏置),以最小化预测误差或损失函数,使模型在面对新数据时更加准确。训练过程包括前向传播、计算损失、反向传播和更新权重等步骤,最终生成权重文件保存模型参数,用于后续的应用和部署。理解生物神经网络的工作原理为人工神经网络的设计提供了灵感,后者广泛应用于图像识别、自然语言处理等领域。
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
Oumi 是一个完全开源的 AI 平台,支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型,提供零样板代码开发体验。
214 43
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
MILS:无需对LLM进行额外训练就能处理多模态任务,Meta AI提出零样本生成多模态描述方法
MILS 是 Meta AI 推出的零样本生成高质量多模态描述方法,支持图像、视频和音频的描述生成,无需额外训练。
109 34
MILS:无需对LLM进行额外训练就能处理多模态任务,Meta AI提出零样本生成多模态描述方法
Light-A-Video:好莱坞级打光自由!上海AI Lab开源视频打光AI,无需训练秒改画面氛围,3步让阴天变夕阳
Light-A-Video 是由上海AI Lab联合交大等高校推出的无需训练的视频重照明方法,支持高质量、时间一致的光照控制,零样本生成和前景背景分离处理。
29 9
FilmAgent:多智能体共同协作制作电影,哈工大联合清华推出 AI 驱动的自动化电影制作工具
FilmAgent 是由哈工大与清华联合推出的AI电影自动化制作工具,通过多智能体协作实现从剧本生成到虚拟拍摄的全流程自动化。
251 10
FilmAgent:多智能体共同协作制作电影,哈工大联合清华推出 AI 驱动的自动化电影制作工具
AutoMouser:AI Chrome扩展程序,实时跟踪用户的浏览器操作,自动生成自动化操作脚本
AutoMouser是一款Chrome扩展程序,能够实时跟踪用户交互行为,并基于OpenAI的GPT模型自动生成Selenium测试代码,简化自动化测试流程。
143 17
AutoMouser:AI Chrome扩展程序,实时跟踪用户的浏览器操作,自动生成自动化操作脚本
PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT
PPTAgent 是中科院推出的自动生成演示文稿框架,基于两阶段编辑方法,支持智能分析、大纲生成、幻灯片生成与评估,适用于教育、企业培训等多种场景。
485 18
PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT
基于AI的自动化事件响应:智慧运维新时代
基于AI的自动化事件响应:智慧运维新时代
113 11
AI辅助的运维流程自动化:实现智能化管理的新篇章
AI辅助的运维流程自动化:实现智能化管理的新篇章
556 22
如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台
如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台
85 10

雷锋网

+ 订阅

热门文章

最新文章