使用机器学习预测电子竞技游戏《守望先锋》的胜负

简介: 机器学习可以预测游戏的输赢?来看看Bowen Yang博士是如何构建这一模型的。


fd079b3d03b7d9bfd7dabcdc085d1e25c6ce2103

《守望先锋》中的英雄

来自加州大学河滨分校的物理学博士学位的Bowen Yang正在致力于构建一个模型——对游戏中的人物特征进行有意义的学习,来预测电子竞技游戏中的获胜团队。这个方法广泛适用于任何具有结构化数据的业务。

现在,电子竞技游戏是一个有着巨大潜力且不断上升的市场。去年,在英雄联盟的世界冠军赛中,仅仅一场半决赛就吸引了1.06亿观众,甚至超过了2018年的超级碗(美国职业橄榄球大联盟年度冠军赛)。为玩家提供个性化游戏分析的公司Visor就希望能够有一个可以实时预测团队胜率的模型。

预测比赛

预测模型有很多种用途。比如,它可以向玩家提供有效反馈,帮助他们提高技能;对于玩家,它可以成为一个很好的参与工具,来吸引那些不熟悉游戏规则的潜在玩家;另外,如果一个模型在预测方面能够超越人类,那么它在电子竞技下注方面就会有着前所未有的潜力。

e94f75b90956026a0081ba3e7f97d00a3896de3e

DOTA2国际邀请赛现场

《守望先锋》简介

我们今天建模的对象是《守望先锋》——一款基于团队的多人在线射击游戏。每个队伍有六名玩家,每位玩家从英雄列表(26名英雄)中选择一个英雄(游戏角色,如超级马里奥),与另一队进行战斗,每场游戏都有特定的游戏地图(游戏开始之前就已设定)。

游戏中有很多因素会影响游戏的预测结果,其中大部分是分类特征。举个例子,英雄的选择对于游戏的前期有着很大的作用。因此,我们面临的挑战是:如何处理这些分类特征。如果我只使用一种热编码,那么特征空间可以很轻松地增长到数百个维度。不幸的是,收集足够多的游戏数据来满足这个高纬度特征空间,这几乎是不可能的。

3e34394b689379028361520ff499e0ee2dbb2108

纵轴和横轴分别为预测准确度与游戏进度,使用热编码特征选择的逻辑回归对预测进行建模。在游戏接近尾声时,预测较为准确;但在游戏开始时,预测几乎是一个随机值(具有0.5的准确性)。

本文将重点介绍如何使用嵌入对这些游戏角色进行建模,以及如何提升预测的准确度。

有关更多细节和实现,请参阅我的Github链接

多个英雄可以组成一个队伍(复仇者

从《魔兽世界》等角色扮演游戏到Dota 2LoLOverwatch等战斗类游戏,团队是现代多人在线视频游戏的核心概念,而英雄则是队伍的基础。

《守望先锋》中的英雄可以分为三类:进攻(DPS)、防御(坦克)和辅助,每个英雄都有自己的强项和弱点。一个团队应该保持英雄成员的平衡(所以没有特定的阵容)、配合(团队配合非常重要),根据当前的作战地图和英雄的技能水平形成团队策略。这和篮球比较比较相似,需要后卫、中锋和前锋合作。因此,团队的组合需要有一定的模式,甚至某个英雄可以在一个团队中共同出现。

ee2981e67a56aee37974c3548fb49873fb40d56c

典型的均衡团队需要有2名防御(坦克)、2名进攻(DPS)和2名辅助。

多个单词可以组成一个句子

我们可以从英雄和单词的类比中得出某些结论。一个单词本身有自己的含义,如果形成一个句子或一篇文章,那么,它的意义更大。同样地,英雄本身也有自己的“含义”和特征,比如一些英雄攻击力强、一些英雄则擅长防守,如果二者组成一个团队,那么,他们的角色会变得更加复杂。

以前,单词是用一个热编码建模的,这种编码很大程度上受到高纬灾难的影响,因为词汇量太大,以至于特征空间的维度可能很容易就超过数十万。一个热编码简单地假设单词之间彼此独立,即它们的表示(representations)是相互正交的,它并不捕获单词在句子中的含义。另一方面,单词也可以表示为分布式表示这样,单词的语义可以通过更低维的矢量(嵌入)来捕获。

当用语词的分布式表示的算法是著名的word2vec模型

超越word2vec

为了利用嵌入的优势,我们应该考虑以下几个事项:

1.相似性:相似性代表了输入之间的“重叠”。例如,“国王”和“女王”代表统治者。输入的重叠越多,它们的嵌入就越密(更小的维度)。换句话说,必须有不同输入到相同输出的映射。如果输入是相互正交的,那么嵌入就没有任何意义了。

2.训练任务:嵌入是从训练任务中(预)学习的。训练任务应该与我们自己的任务相关,因此嵌入的信息是可转移的。例如,word2vecGoogle新闻上进行训练,然后用于机器翻译。它们是相关的,因为它们的词语具有相同的语义含义。

3.大量的数据:为了找到输入数据之间的相似性或关系,我们需要大量数据来探索高维度空间。因为有大量的可用于无监督学习的数据,分布式表示可以减少维度背后的“黑魔法”。例如,word2vec模型在数十亿字上进行训练。在一定程度上,嵌入仅仅是独热编码输入和下行任务之间的附加线性层的权重。为了训练包括嵌入层的整个管道,我们仍然需要大量数据来填充高维度输入空间。Continuous bag of heroes模型

考虑完以上几个问题,我们现在开始设计Hero2vec模型。

1.相似性:如前所述,《守望先锋》中的英雄属于某些类别。这种相似性表明它们可以通过分布式表示来描述,而不是一个热正交编码。

2.训练任务:通过对中心词和上下文词的共现进行建模,word2vec试图来捕捉单词的一般语义含义。同样,高协作性的英雄很可能会在一个团队中同时出现,即联合概率Ph0h1... h5)很高(h代表英雄)。但是,对这个联合概率进行建模并没有非常简单。或者,我们可以尝试使用最大化条件概率Ph0 | h1h2... h5)来建模。由于游戏的预测只是P(结果| h0h1... h5,其他因素),因此这两个任务是高度相关。

ee2981e67a56aee37974c3548fb49873fb40d56c

给定一个团队中的五个英雄,我们就可以预测出生存到最后的的英雄。例如,如果一支球队已经有2名后卫,2名中锋和1名前锋,那么最后一名球员很有可能成为球队的前锋。

3.数据Visor提供了超过30,000多种团队组合用于预训练嵌入。与数十亿的单词相比,30,000个组合可能看起来很小,同样,输入维度也比词汇表中的单词(例如260,000+)要小的多(26英雄)。考虑到训练数据的需求随维度呈指数增长,实际上,30,000个组合足够进行训练。

4.模型:概率Ph0 | h1h2... h5)与word2vec中连续词袋(CBOW)模型中的P(中心词语|上下文词语)完全相同。不同于单词的是,(h1h2... h5)之间相互置换,并不会影响概率,因此(h1h2... h5)的嵌入总和实际上就是输入总和。在这里,除了Ph0 | h1h2... h5)外,我们还可以对Ph1 | h0h2... h5)等进行建模,使数据集可以有效的扩展6次。

76bcfa52ee9bfe25de56a010d09f0a1591f44333

Hero2vec的模型架构,包括嵌入层、全连接神经网络和softmax层。由于softmax层只有26个目标,所以不需要负采样。

英雄的可视化处理

可以将英雄的嵌入(10个维度)投影到二维平面上(使用PCA),实现可视化,如下图所示。

dfb5156afae0a09f8c50bf9ceff0dbd91d9f3c02

英雄的嵌入(投影到二维平面上)

显然,嵌入成功地捕捉了英雄背后的游戏设计。英雄根据自己的角色或类别进行聚类。更有意思的是,嵌入还可以捕捉英雄超越其类别内其它英雄的更微妙的特征。例如,尽管Roadhog英雄是防御(坦克),玩家仍然把它看作进攻(DPS);虽然Symmetra是辅助,但它并不能治愈队友,所以她更接近进攻(DPS)和防御(坦克)等。玩家并不像游戏设计师所认为的那样,将它们视为两类。对于熟悉《守望先锋》的玩家来说,进攻型DPS和防御性DPS之间的界限非常模糊,也就是说,玩家并没有根据游戏设计的本意,将它们归为两类。

因此,与硬编码类别的英雄(或产品)相比,在捕捉英雄的特征或属性时,嵌入可以更加流畅和准确的对其进行捕捉,即玩家和游戏设计者都能从嵌入中提取更多有用的信息。玩家可以用这个模型来更好地理解或欣赏该游戏,而游戏设计师也可以利用该模型对游戏设计进行验证和改进。

Map2vec

我们已经讨论过了如何在游戏中模拟英雄。在介绍英雄嵌入是如何帮助我们预测游戏胜负之前,我想简单地谈谈如何处理另一个分类特征——地图。

《守望先锋》的每场游戏都是在特定的游戏地图上进行的,而团队的组合取决于地图的布局,即P(团队|地图)。通过贝叶斯规则重写,P(团队|地图)〜P(地图|团队)P(团队)。因此,我们可以用P(地图|团队)来嵌入地图,如下所示。

e6407891cfb096b595aaa41216d4a94108e8aeea

map2vec的模型结构。包括英雄的嵌入层、全连接神经网络和softmax层。softmax层的权重是地图的嵌入。

与上面的Hero2vec模型不同的是:映射的嵌入是从最后一个线性层绘制的,word2vec模型的输入嵌入和输出嵌入都可以用来代表单词。

同样的,地图的嵌入也可以进行可视化。

dfb5156afae0a09f8c50bf9ceff0dbd91d9f3c02

地图的可视化

通过嵌入,我们可以很好地理解地图背后的游戏设计。对于那些熟悉《守望先锋》的玩家来说,能够看到单个地图的进攻区域和防御区域之间的差异,这比查看地图之间的差异要更有意思。

相同的体系结构可以对任何共同出现的事务进行建模。例如,输入为一堆电影,目标为喜欢这些电影的特定客户。训练这个管道,就可以为我们提供电影和客户的嵌入。

使用英雄嵌入来预测游戏的胜负

使用英雄嵌入,可以提高游戏预测的准确度,如下图所示:

e6407891cfb096b595aaa41216d4a94108e8aeea

纵轴和横轴分别为预测准确度与游戏进度。用Hero2vec嵌入,该逻辑回归模型可以提高游戏前期的预测准确度。

如上图所示,二者都使用逻辑回归,当输入为英雄嵌入时,预测的准确度要比输入为一个热编码时高。更值得一提的是,英雄嵌入的确可以提升游戏前期或中期的预测准确度。

团队中英雄的组合能够为模型提供很多信息,这其中的一个原因就是,在游戏开始时,数字特征几乎不会有任何变化,因此,在游戏前期,数字特征基本上没有什么用处。随着游戏进入中期,数字特征种会积累更多的信息,这样一来,团队中英雄的组合形式就不再那么重要了。当游戏打到后期时,两个预测结果重叠,因为数值特征中的值足够多,足以来预测游戏结果。

 

9d1445d2e94eb06d1b230b70dc62b7c0354a8eb3

游戏结果与两个重要的数字特征。在游戏前期时(左下角),特征差异不大,结果几乎是重叠的。随着游戏继续进展(朝右上角),方差逐渐变大,预测结果也可以很容易的分开。

总结

本文讨论了如何用低维分布表示来表示高维分类特征,并遵循NLPword2vec算法的逻辑。

通过对《守望先锋》中的英雄进行预训练,我构建了一个可以预测游戏胜负的可靠模型。并且,该模型在游戏前期的预测准确率更高,更为详细的模型和代码请查看我的Git

  数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

以上为译文。

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Predicting e-sports winners with Machine Learning》,译者:Mags,审校:袁虎。

文章为简译,更为详细的内容,请查看原文 

相关文章
|
4月前
|
图形学 机器学习/深度学习 人工智能
颠覆传统游戏开发,解锁未来娱乐新纪元:深度解析如何运用Unity引擎结合机器学习技术,打造具备自我进化能力的智能游戏角色,彻底改变你的游戏体验——从基础设置到高级应用全面指南
【8月更文挑战第31天】本文探讨了如何在Unity中利用机器学习增强游戏智能。作为领先的游戏开发引擎,Unity通过ML-Agents Toolkit等工具支持AI代理的强化学习训练,使游戏角色能自主学习完成任务。文章提供了一个迷宫游戏示例及其C#脚本,展示了环境观察、动作响应及奖励机制的设计,并介绍了如何设置训练流程。此外,还提到了Unity与其他机器学习框架(如TensorFlow和PyTorch)的集成,以实现更复杂的游戏玩法。通过这些技术,游戏的智能化程度得以显著提升,为玩家带来更丰富的体验。
69 1
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】python之人工智能应用篇--游戏生成技术
游戏生成技术,特别是生成式人工智能(Generative Artificial Intelligence, 简称Generative AI),正逐步革新游戏开发的多个层面,从内容创作到体验设计。这些技术主要利用机器学习、深度学习以及程序化内容生成(Procedural Content Generation, PCG)来自动创造游戏内的各种元素,显著提高了开发效率、丰富了游戏内容并增强了玩家体验。以下是生成式AI在游戏开发中的几个关键应用场景概述
88 2
|
7月前
|
机器学习/深度学习 人工智能 算法
【Python 机器学习专栏】强化学习在游戏 AI 中的实践
【4月更文挑战第30天】强化学习在游戏AI中展现巨大潜力,通过与环境交互和奖励信号学习最优策略。适应性强,能自主探索,挖掘出惊人策略。应用包括策略、动作和竞速游戏,如AlphaGo。Python是实现强化学习的常用工具。尽管面临训练时间长和环境复杂性等挑战,但未来强化学习将与其他技术融合,推动游戏AI发展,创造更智能的游戏体验。
374 0
|
机器学习/深度学习 存储 算法
机器学习:基于决策树的 XX联盟游戏胜负预测
机器学习:基于决策树的 XX联盟游戏胜负预测
239 0
|
机器学习/深度学习
【阿旭机器学习实战】【13】决策树分类模型实战:泰坦尼克号生存预测
【阿旭机器学习实战】【13】决策树分类模型实战:泰坦尼克号生存预测
【阿旭机器学习实战】【13】决策树分类模型实战:泰坦尼克号生存预测
|
机器学习/深度学习 移动开发 Windows
机器学习奥林匹克-身体健康与幸福之心脏病预测
机器学习奥林匹克-身体健康与幸福之心脏病预测
430 0
机器学习奥林匹克-身体健康与幸福之心脏病预测
|
机器学习/深度学习 数据处理
机器学习——PM2.5预测白话
本项目仅用于参考,提供思路和想法并非标准答案!请谨慎抄袭!
424 0
机器学习——PM2.5预测白话
|
机器学习/深度学习 数据采集 人工智能
就离谱!使用机器学习预测2022世界杯:小组赛挺准,但冠亚季军都错了 ⛵
本文使用机器学习建模对 FIFA 2022世界杯结果进行了预测,赛后将其与真实结果进行比较,可以看出:小组赛到1/4决赛的预测准确率很高,半决赛和决赛的预测准确率为0,冠亚季军无一预测准确。
141 0
就离谱!使用机器学习预测2022世界杯:小组赛挺准,但冠亚季军都错了 ⛵
|
机器学习/深度学习 算法
​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(三)
​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(三)
241 0
​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(三)
|
机器学习/深度学习 vr&ar
​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(二)
​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(二)
237 0
​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(二)