小白学数据分析------->相关分析在充值与购买失衡分析的应用探索

简介: 昨天简单的说过充值记录的分析方法,今天介绍一下使用相关分析,说说充值与购买的数据相关分析。在很多类型的游戏中,我们经常会做累计充值活动,然而并不是所有的累计充值活动都做的很好,而且某些类型的游戏不适合频繁作累计充值活动,究其原因,其中之一就是会造成充值与购买的失衡,通俗的说就是会存在持币待购的情况,我们希望正常或者良性的循环是充值购买为1:1,这点对于平衡消费,稳定消费结构很重要,当然了实际运营中我们也会面临很多的突发因素,比如游戏内容调整,游戏数值调整,版本IB刺激等等。

昨天简单的说过充值记录的分析方法,今天介绍一下使用相关分析,说说充值与购买的数据相关分析。在很多类型的游戏中,我们经常会做累计充值活动,然而并不是所有的累计充值活动都做的很好,而且某些类型的游戏不适合频繁作累计充值活动,究其原因,其中之一就是会造成充值与购买的失衡,通俗的说就是会存在持币待购的情况,我们希望正常或者良性的循环是充值购买为1:1,这点对于平衡消费,稳定消费结构很重要,当然了实际运营中我们也会面临很多的突发因素,比如游戏内容调整,游戏数值调整,版本IB刺激等等。但是如果出现持币待购也就是说充值远远大于购买时,我们就需要警惕和分析原因。

但是我们如何来判定和量化持币待购的情况?这里我们将采用相关分析的方法来解决。所谓相关分析(Correlation Analysis)是考察两个变量的相互变化的关系程度,与回归分析不同的是,相关分析的两个变量地位是平等的,不存在因果关系。相关关系是变量之间保持某种不确定的依存关系,相关分析可以借助散点图或者诸如相关系数来考察变量间的关联程度。

变量的相关关系按照两者的变动分为正相关和负相关,正相关也就是相关系数为正,两个因素同方向变动,一个增大另一个也增大,而负相关就是相关系数为负,两个因素按照反方向变动,一个增大另一个却反而减小。

按照相关的程度来看,相关关系可以分为完全相关、不相关和不完全相关。当一个变量变化完全由另一个变量决定时,这种关系为完全相关;如果彼此互不影响,变量各自独立,就是不相关;而两个变量之间关系介于完全相关和不相关之间就是不完全相关。

关于描述相关系数的方法有很多种,这里不再讲解,一般而言我们比较关注相关分析按照影响因素(变量)如何确定分析方法,对于我们今天讨论的充值购买的相关分析就是双变量相关分析,即通过计算两个变量之间的相关系数,对两个变量之间是否显著相关做出判断。另外还有偏相关分析,当出现多个变量时,直接对两个变量进行相关分析往往不能真实反映二者之间的相关关系,这时就需要用偏相关分析,剔出其他变量的线性影响。最后一种是距离分析,当出现了多个变量而不能每个分析解决时,此时将所有的变量按照一定的标准分类,即聚类分析。

相关分析在Excel和SPSS中均有相关的模块可用于分析,今天说说在Excel中怎么使用相关分析,在Excel中判断相关关系的方法有两种,即散点图和相关关系分析工具。散点图这里就不再累述了,简单说说相关关系分析工具的使用。

首先在Excel中把数据分析模块调用出来,点击开始,选择Excel选项

选择加载项|分析工具库|转到

之后打开如下的对话框,选择分析工具库,点击确定,最后会在数据标签下出现数据分析的加载项。

随后选择数据分析|相关系数,出现相关系数对话框。在输入区域需要输入分析数据区域的单元格引用,且引用数据区域必须是两个或者以上的行或者列的相邻数据区域。这里我们选取某一月的每名玩家的充值总额和该月相应的购买总额。

分组方式是数据区域是按照行或者列排列,单击逐行或者逐列。

标志位于第一行/标志位于第一列,如果输入区域的第一行显示变量名,选中标志位于第一行,列的形式一样。如果输入区域没有变量,无需选择。

之后会输出一个相关分析结果的表格,该表格会把两个变量的相关系数计算出来,根据计算的系数就能够了解充值总额和购买总额的相关系数。相关系数一般会呈现两种结果。

正相关:随着充值总额的增加,购买总额也增加,此时充值和购买的平衡保持较稳(当然这种分析不是绝对的,不要只限于用这一种方法就断言充值购买的平衡性,还要结合其他数据来看待,切忌)

负相关:随着充值的增加,购买反而减少,呈反向变化趋势,此时为充值购买不平衡的情况出现,可以作为一个参考指标。

p.s.做这种相关分析要注意维度的把握,比如是新登玩家、回流玩家等等,可以更加明确的分析和把握客群特点,因为在APA群体中,发生充值购买失衡不一定是整个的APA群体,不断地细分APA客群,可以更好地进行分析。进而当我们找到了充值购买失衡最为严重的APA群体后,在通过聚类分析、RFM分析等更加深刻描述和分析问题。这是一个系列的过程,相关性的分析只是在第一步把充值购买的失衡问题暴露出来,这只是一种手段,但不是唯一。

相关文章
|
4天前
|
数据采集 监控 数据可视化
BI工具在数据分析和业务洞察中的应用
BI工具在数据分析和业务洞察中的应用
24 11
|
20天前
|
消息中间件 数据挖掘 Kafka
Apache Kafka流处理实战:构建实时数据分析应用
【10月更文挑战第24天】在当今这个数据爆炸的时代,能够快速准确地处理实时数据变得尤为重要。无论是金融交易监控、网络行为分析还是物联网设备的数据收集,实时数据处理技术都是不可或缺的一部分。Apache Kafka作为一款高性能的消息队列系统,不仅支持传统的消息传递模式,还提供了强大的流处理能力,能够帮助开发者构建高效、可扩展的实时数据分析应用。
64 5
|
16天前
|
数据采集 数据可视化 数据挖掘
数据驱动决策:BI工具在数据分析和业务洞察中的应用
【10月更文挑战第28天】在信息爆炸的时代,数据成为企业决策的重要依据。本文综述了商业智能(BI)工具在数据分析和业务洞察中的应用,介绍了数据整合、清洗、可视化及报告生成等功能,并结合实际案例探讨了其价值。BI工具如Tableau、Power BI、QlikView等,通过高效的数据处理和分析,助力企业提升竞争力。
34 5
|
23天前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
38 2
|
1月前
|
搜索推荐 数据挖掘
ChatGPT数据分析应用——漏斗分析
ChatGPT数据分析应用——漏斗分析
|
1月前
|
数据可视化 搜索推荐 数据挖掘
ChatGPT数据分析应用——同期群分析
ChatGPT数据分析应用——同期群分析
|
1月前
|
数据挖掘 UED
ChatGPT数据分析——探索性分析
ChatGPT数据分析——探索性分析
|
1月前
|
数据可视化 数据挖掘 数据处理
ChatGPT数据分析应用——热力图分析
ChatGPT数据分析应用——热力图分析
|
1月前
|
SQL 分布式计算 数据挖掘
加速数据分析:阿里云Hologres在实时数仓中的应用实践
【10月更文挑战第9天】随着大数据技术的发展,企业对于数据处理和分析的需求日益增长。特别是在面对海量数据时,如何快速、准确地进行数据查询和分析成为了关键问题。阿里云Hologres作为一个高性能的实时交互式分析服务,为解决这些问题提供了强大的支持。本文将深入探讨Hologres的特点及其在实时数仓中的应用,并通过具体的代码示例来展示其实际应用。
163 0
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
如何理解数据分析及数据的预处理,分析建模,可视化
如何理解数据分析及数据的预处理,分析建模,可视化
49 0