《R语言游戏数据分析与挖掘》一1.2 游戏数据分析的流程

简介: 本节书摘来华章计算机《R语言游戏数据分析与挖掘》一书中的第1章 ,第1.2节,谢佳标 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.2 游戏数据分析的流程

游戏数据分析、数据挖掘的价值一定要落实到具体的业务应用中才可以得到检验和实现,所以需要流程和制度来有效保障最终的业务实践效果。这些流程一方面可以促使各相关方在数据分析业务实践的不同阶段落实各自的角色、分工和价值,维护整个业务流的畅通和效率;另一方面可以有效达成数据分析项目中各环节的阶段性目标。
游戏数据分析整体流程可以参考跨行业的数据挖掘标准流程CRISP-DM方法论,它是一种业界认可的用于指导数据挖掘工作的方法。按照CRISP-DM方法论,一个游戏数据分析的完整流程包括6个阶段,分别是业务理解、数据理解、数据准备、建立模型、模型评估和模型发布。这6个阶段的顺序并不是固定不变的,在不同的业务场景中,可以有不同的流转方向。但是总体来说,业务理解是第一位的,是游戏数据分析流程中的第1环节,制定了业务目标后,就可以针对业务目标进行数据收集、数据清洗、数据转换、数据建模及模型评估等流程。
图1-1是CRISP-DM方法论的示意图。它的外圈象征游戏数据分析自身的循环本质,数据分析过程可以不断循环、优化,后续的过程可以从前面的过程中得到借鉴和启发。

  • 业务理解:该阶段的核心内容包括正确理解业务背景和业务需求,同时能把业务需求有效转化成合理的分析需求,并设计指标体系和拟定实施计划。例如,业务有关于核心用户画像的需求,但是由于休闲游戏的大多数玩家是游客登录,并没有注册,所以无法收集到玩家的基础属性信息,从而不能帮助业务对核心用户的性别、年龄、职业等属性进行画像,此时可以从游戏活跃、付费、行为等角度进行核心用户画像,将业务的需求转换成目前数据能支撑到的分析需求。

image

  • 数据理解:该阶段从数据收集开始,并对可用的数据进行数据探索和评估,识别数据质量问题,发现数据不同属性间的关系。
  • 数据准备:这个阶段主要是做数据清洗和转换工作,包含数据缺失值和异常值的处理,保证建模前的数据质量;数据的重组、转换以及衍生等处理,比如对数据进行标准化处理、对某些指标进行分箱操作以便达到建模需求。
  • 建立模型:这是游戏数据分析流程中技术含量最高的阶段,数据分析师应该根据项目需求和数据特点选择合适的算法,并使用专业的数据挖掘工具建立模型。
  • 模型评估:评估建立模型的稳定性和有效性,常用的模型评估方法有混淆矩阵、ROC曲线、K-S曲线、交叉验证等。根据评估结果判断是否满足当初的业务需求,如果模型未满足需求,需要重复上一阶段的建模工作,有时甚至需要从数据收集阶段重新开始。如果现有数据不能满足分析需求,就需要业务和开发人员参与,在游戏中重新埋点收集数据。
  • 模型发布:将模型应用于业务实践,才能实现数据分析挖掘的商业价值。根据业务反馈的结果,进而调整分析方法。
相关文章
|
2月前
|
数据挖掘 PyTorch TensorFlow
|
16天前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
35 2
|
16天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
21 2
|
1月前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
38 1
|
3月前
|
数据采集 算法 数据挖掘
10余位大佬+10余年经验的结晶:Python数据分析与挖掘实战
LinkedIn 对全球超过3.3亿用户的工作经历和技能进行分析后得出,目前最炙手可热的25 项技能中,数据挖掘排名第一。那么数据挖掘是什么? 数据挖掘是从大量数据(包括文本)中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。数据挖掘有助于企业发现业务的趋势,揭示已知的事实,预测未知的结果,因此“数据挖掘”已成为企业保持竞争力的必要方法。 今天给小伙伴们分享的Python数据分析与数据挖掘手册是10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、
10余位大佬+10余年经验的结晶:Python数据分析与挖掘实战
|
2月前
|
数据采集 算法 搜索推荐
R语言营销数据分析:使用R进行客户分群的实践探索
【9月更文挑战第1天】R语言以其强大的数据处理和统计分析能力,在金融数据分析、营销数据分析等多个领域发挥着重要作用。通过R语言进行客户分群,企业可以更好地理解客户需求,制定精准的营销策略,提升市场竞争力和客户满意度。未来,随着大数据和人工智能技术的不断发展,R语言在营销数据分析中的应用将更加广泛和深入。
|
3月前
|
数据采集 算法 数据挖掘
10余位大佬+10余年经验的结晶:Python数据分析与挖掘实战
LinkedIn 对全球超过3.3亿用户的工作经历和技能进行分析后得出,目前最炙手可热的25 项技能中,数据挖掘排名第一。那么数据挖掘是什么? 数据挖掘是从大量数据(包括文本)中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。数据挖掘有助于企业发现业务的趋势,揭示已知的事实,预测未知的结果,因此“数据挖掘”已成为企业保持竞争力的必要方法。 今天给小伙伴们分享的Python数据分析与数据挖掘手册是10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、
|
4月前
|
数据挖掘 PyTorch TensorFlow
Python数据分析新纪元:TensorFlow与PyTorch双剑合璧,深度挖掘数据价值
【7月更文挑战第30天】随着大数据时代的发展,数据分析变得至关重要,深度学习作为其前沿技术,正推动数据分析进入新阶段。本文介绍如何结合使用TensorFlow和PyTorch两大深度学习框架,最大化数据价值。
101 8
|
3月前
|
机器学习/深度学习 数据可视化 数据挖掘
为啥我敢说Python是数据分析界的扛把子语言?
为啥我敢说Python是数据分析界的扛把子语言?
|
3月前
|
机器学习/深度学习 数据采集 运维
数据分析与挖掘
数据分析与挖掘
下一篇
无影云桌面