《R语言游戏数据分析与挖掘》一1.2 游戏数据分析的流程

简介: 本节书摘来华章计算机《R语言游戏数据分析与挖掘》一书中的第1章 ,第1.2节,谢佳标 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.2 游戏数据分析的流程

游戏数据分析、数据挖掘的价值一定要落实到具体的业务应用中才可以得到检验和实现,所以需要流程和制度来有效保障最终的业务实践效果。这些流程一方面可以促使各相关方在数据分析业务实践的不同阶段落实各自的角色、分工和价值,维护整个业务流的畅通和效率;另一方面可以有效达成数据分析项目中各环节的阶段性目标。
游戏数据分析整体流程可以参考跨行业的数据挖掘标准流程CRISP-DM方法论,它是一种业界认可的用于指导数据挖掘工作的方法。按照CRISP-DM方法论,一个游戏数据分析的完整流程包括6个阶段,分别是业务理解、数据理解、数据准备、建立模型、模型评估和模型发布。这6个阶段的顺序并不是固定不变的,在不同的业务场景中,可以有不同的流转方向。但是总体来说,业务理解是第一位的,是游戏数据分析流程中的第1环节,制定了业务目标后,就可以针对业务目标进行数据收集、数据清洗、数据转换、数据建模及模型评估等流程。
图1-1是CRISP-DM方法论的示意图。它的外圈象征游戏数据分析自身的循环本质,数据分析过程可以不断循环、优化,后续的过程可以从前面的过程中得到借鉴和启发。

  • 业务理解:该阶段的核心内容包括正确理解业务背景和业务需求,同时能把业务需求有效转化成合理的分析需求,并设计指标体系和拟定实施计划。例如,业务有关于核心用户画像的需求,但是由于休闲游戏的大多数玩家是游客登录,并没有注册,所以无法收集到玩家的基础属性信息,从而不能帮助业务对核心用户的性别、年龄、职业等属性进行画像,此时可以从游戏活跃、付费、行为等角度进行核心用户画像,将业务的需求转换成目前数据能支撑到的分析需求。

image

  • 数据理解:该阶段从数据收集开始,并对可用的数据进行数据探索和评估,识别数据质量问题,发现数据不同属性间的关系。
  • 数据准备:这个阶段主要是做数据清洗和转换工作,包含数据缺失值和异常值的处理,保证建模前的数据质量;数据的重组、转换以及衍生等处理,比如对数据进行标准化处理、对某些指标进行分箱操作以便达到建模需求。
  • 建立模型:这是游戏数据分析流程中技术含量最高的阶段,数据分析师应该根据项目需求和数据特点选择合适的算法,并使用专业的数据挖掘工具建立模型。
  • 模型评估:评估建立模型的稳定性和有效性,常用的模型评估方法有混淆矩阵、ROC曲线、K-S曲线、交叉验证等。根据评估结果判断是否满足当初的业务需求,如果模型未满足需求,需要重复上一阶段的建模工作,有时甚至需要从数据收集阶段重新开始。如果现有数据不能满足分析需求,就需要业务和开发人员参与,在游戏中重新埋点收集数据。
  • 模型发布:将模型应用于业务实践,才能实现数据分析挖掘的商业价值。根据业务反馈的结果,进而调整分析方法。
相关文章
|
2月前
|
监控 安全 数据可视化
R语言在员工上网行为监控中的数据分析
本文讲述了如何使用R语言分析员工上网行为以提升企业网络安全。通过收集网络流量和访问记录数据,利用R进行读取、分析和可视化,例如查看访问时长分布和热门网站。此外,文中还介绍了一个自动将监控数据提交到网站的R脚本,通过定时任务实现数据的持续更新和管理,及时发现并应对安全风险,增强网络安全性。
259 3
|
2月前
|
数据可视化 前端开发 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(上)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享
|
2月前
|
算法 搜索推荐 数据挖掘
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(续)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(续)
107 1
|
2月前
|
机器学习/深度学习 数据采集 算法
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)
118 1
|
2月前
|
数据可视化 搜索推荐 数据挖掘
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)
393 1
|
2月前
|
机器学习/深度学习 数据挖掘 计算机视觉
R语言中的神经网络预测时间序列:多层感知器(MLP)和极限学习机(ELM)数据分析报告
R语言中的神经网络预测时间序列:多层感知器(MLP)和极限学习机(ELM)数据分析报告
|
2月前
|
数据可视化
R语言大学城咖啡店消费问卷调查数据报告:信度分析、主成分分析可视化
R语言大学城咖啡店消费问卷调查数据报告:信度分析、主成分分析可视化
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
R语言电影数据分析:随机森林探索电影受欢迎程度因素、参数调优可视化
R语言电影数据分析:随机森林探索电影受欢迎程度因素、参数调优可视化
|
2月前
|
机器学习/深度学习 数据可视化 数据挖掘
R语言用逻辑回归预测BRFSS中风数据、方差分析anova、ROC曲线AUC、可视化探索
R语言用逻辑回归预测BRFSS中风数据、方差分析anova、ROC曲线AUC、可视化探索
|
2月前
|
前端开发 数据可视化 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(下)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享