足球指数逝世启示录:AI在Dota中猜测玩家五秒秒后逝世

足球指数 1

OpenAI Dota 2 竞技现场

这种 AI
技术在未来或许能够为游戏解说和观众们带来便利:忽然出现的击杀总会是游戏最精彩的部分,而关于玩家来说,他们或许还能找到更大胆的想法。

论文:Time to Die: Death Prediction in Dota 2 using Deep Learning

论文链接:://arxiv.org/pdf/1906.03939.pdf

Valve 公司发行的 Dota 2 是一款多人在线竞技游戏。游戏分为两方,每方拥有 5
名玩家,意图是占据敌方和防护己方基地,并企图损坏坐落地图两端的建筑物。每个玩家都有一套共同的战斗技术,同时搜集经验值和配备以解锁新的进犯和防护动作。

Dota 2 实际操作起来会更杂乱。均匀每场竞赛包括 80,000
个单个帧,其间每个人物能够执行 170,000
个或许的动作。游戏中的玩家在每帧上均匀完成 10,000
个动作,使游戏的总维度超过
20,000。游戏中的每个玩家都能够捡起或许购买上百件虚拟配备。

研讨者在论文中指出,人物的生命值并不总是与逝世与否挂钩,因为一些人物具有治愈能力,并且玩家还能够经过购买虚拟配备来治愈或许经过传送远离危险。考虑到这一点,研讨者获取了
Valve 公司 12 月 5 日之前 5000 场工作和 5000
场半工作竞赛的回放文件。他们的语料库在预处理和差错核算后共包括 7311
个文件,并经过在 4-tick
采样周期内记录特点集数值,研讨者从语料库中提取数据并转化为时刻序列。

基于语料库中的数据,研讨者为每个玩家人物提取了 287
个特征,其间一些特征是游戏目标特点值。研讨表明,时刻、玩家当时状况、可激活配备、英豪技术、走位、与最近的存活敌人和己方防护塔的距离以及可见性前史是导致玩家逝世的一些最重要因素,其间英豪的相对力量值和特定时刻内涵地图上的方位居首位。

根据逝世猜测的特点,研讨者需要创建一个能够捕获相关数据的特搜集。他们首先着眼于导致玩家逝世的两个最重要因素相对力量值和特定时刻内它们在地图上的当时方位。从最开始的少数特征开始构建,研讨者终究得到了包括每位英豪
287
个特征的特搜集。一些特征是游戏目标特点值,如英豪生命值;其他一些则是派生值,如与其他玩家的附近值。下表给出了一些重要特征的详细描述。

表 1:各类特征的详细信息。

研讨者表明:玩家采纳举动时的确依靠以往行为。例如,假如一名敌人脱离视线,玩家依然清楚这名敌人还在这个区域。另一方面,假如一名敌人在几分钟前消失了,则从玩家的角度看,这名敌人能够在地图的任何方位。这就是咱们增加可视性前史特征的原因。

研讨者将练习数据2870 个输入和 5760 万个单个数据点,即 10 位玩家的 287
个特征相乘的成果馈入到机器学习算法中,别离保存 10%
的数据用于验证和测试。他们在试验中发现,当猜测竞赛双方 10
位玩家中哪位玩家会在 5 秒内逝世时,该模型实现了 0.5447
的均匀精度。此外,研讨表明,该模型能够在指定的 5
秒窗口出现之前猜测玩家逝世,说明它现已学会了与逝世相关的固有特点。

模型详解

研讨者将具有权重同享的深度前馈神经网络作为模型。该神经网络的输入包括每位英豪的特征。在最大的特搜集中,每位英豪具有
287 个特征,则 10 位英豪具有 2870 个输入。因而,该网络具有 10
个独立的继续输出,代表每位玩家在接下来 5 秒内逝世的概率。

网络架构

图 1:网络架构概览图。

图 1 为该网络的架构概览,显现了输入如何进入同享的网络结构。

此处一切的权重都是同享的,本质上是创建一个子网络,该子网络为英豪特性学习一个新的、更密布的表征。连接层顺便来自每个同享层的输出,为网络结构的最终一部分创建一个输入张量。每个隐藏层的输出都运用
RELU 函数,但网络的最终一个激活函数用的是 Sigmoid 函数。

特搜集

由于游戏杂乱度高,研讨者不确认网络是否能够利用一切的特征类别。为了深入了解,研讨者创建了三个独立的特搜集并利用三个独立的超参数查找运行三个练习过程:

最小的特搜集只包括当时生命值、总金币、方位、英豪和塔的附近特征。选择这些特征是因为研讨者以为它们包括更多信息。

中等特搜集包括除了英豪 ID 和能力特征之外的一切特征。

大型特搜集包括全部的特征。

练习网络

关于每一个特搜集,研讨者运用基于随机查找的探索来确认最佳超参数,用于:层数、每层的神经元数、学习率和批巨细,详细信息见表
II。

成果

表 III
显现了最佳模型在测试集上的功能。成果表明,该网络能够利用额定的特征。

体现最佳的模型达到了 0.5447
的均匀精度,研讨者利用这一模型进行进一步分析。

该模型的精度-召回率曲线如图 3
所示。该图显现了阈值和精度及召回率之间的权衡。

值得注意的是,虽然用来猜测逝世的时刻是 5
秒,但这一时刻也能够增加。但为了减少核算混淆,这些猜测将被视为不精确猜测。猜测时刻为
0-5 秒以及延长到 20 秒时的概率输出如下图所示:

研讨者坦言,他们的方法也有一些限制,如系统需要 200
多个游戏数据点来辅助猜测以及或许无法泛化到新的游戏版本。但是,研讨者表明,他们规划的模型或许对紧盯竞赛进程的解说员和玩家有用。

足球指数 ,现在,该模型现已在 GitHub
上开源:://github.com/adam-katona/dota2_death_prediction

电子竞技游戏非常杂乱,几秒钟之内的一个瞬移都有或许改动游戏的平衡,并且,多个事情或许在游戏场地的多个区域同时发生。这些事情或许发生地很快,解说员和观众很简单错失某个事情,而只看到事情的后续影响,该团队写道。在
Dota 2 中,某个人物被敌人杀掉是解说员和观众感兴趣的事情。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图