1.2 游戏数据分析的流程
游戏数据分析、数据挖掘的价值一定要落实到具体的业务应用中才可以得到检验和实现,所以需要流程和制度来有效保障最终的业务实践效果。这些流程一方面可以促使各相关方在数据分析业务实践的不同阶段落实各自的角色、分工和价值,维护整个业务流的畅通和效率;另一方面可以有效达成数据分析项目中各环节的阶段性目标。
游戏数据分析整体流程可以参考跨行业的数据挖掘标准流程CRISP-DM方法论,它是一种业界认可的用于指导数据挖掘工作的方法。按照CRISP-DM方法论,一个游戏数据分析的完整流程包括6个阶段,分别是业务理解、数据理解、数据准备、建立模型、模型评估和模型发布。这6个阶段的顺序并不是固定不变的,在不同的业务场景中,可以有不同的流转方向。但是总体来说,业务理解是第一位的,是游戏数据分析流程中的第1环节,制定了业务目标后,就可以针对业务目标进行数据收集、数据清洗、数据转换、数据建模及模型评估等流程。
图1-1是CRISP-DM方法论的示意图。它的外圈象征游戏数据分析自身的循环本质,数据分析过程可以不断循环、优化,后续的过程可以从前面的过程中得到借鉴和启发。
- 业务理解:该阶段的核心内容包括正确理解业务背景和业务需求,同时能把业务需求有效转化成合理的分析需求,并设计指标体系和拟定实施计划。例如,业务有关于核心用户画像的需求,但是由于休闲游戏的大多数玩家是游客登录,并没有注册,所以无法收集到玩家的基础属性信息,从而不能帮助业务对核心用户的性别、年龄、职业等属性进行画像,此时可以从游戏活跃、付费、行为等角度进行核心用户画像,将业务的需求转换成目前数据能支撑到的分析需求。
- 数据理解:该阶段从数据收集开始,并对可用的数据进行数据探索和评估,识别数据质量问题,发现数据不同属性间的关系。
- 数据准备:这个阶段主要是做数据清洗和转换工作,包含数据缺失值和异常值的处理,保证建模前的数据质量;数据的重组、转换以及衍生等处理,比如对数据进行标准化处理、对某些指标进行分箱操作以便达到建模需求。
- 建立模型:这是游戏数据分析流程中技术含量最高的阶段,数据分析师应该根据项目需求和数据特点选择合适的算法,并使用专业的数据挖掘工具建立模型。
- 模型评估:评估建立模型的稳定性和有效性,常用的模型评估方法有混淆矩阵、ROC曲线、K-S曲线、交叉验证等。根据评估结果判断是否满足当初的业务需求,如果模型未满足需求,需要重复上一阶段的建模工作,有时甚至需要从数据收集阶段重新开始。如果现有数据不能满足分析需求,就需要业务和开发人员参与,在游戏中重新埋点收集数据。
- 模型发布:将模型应用于业务实践,才能实现数据分析挖掘的商业价值。根据业务反馈的结果,进而调整分析方法。