小白学数据分析-----> 留存率是什么?(番外篇)

简介: 最近一个时期和很多的人进行了交流,收获了不少,也思考了不少,如今我们都能得到数据,如今我们也都能按照所谓的定义和框架分析问题,只是我觉得有时候不必要一定要一直站在框架内去分析一些问题,进步和前进的力量来自于质疑,并进行革新和再创造。

最近一个时期和很多的人进行了交流,收获了不少,也思考了不少,如今我们都能得到数据,如今我们也都能按照所谓的定义和框架分析问题,只是我觉得有时候不必要一定要一直站在框架内去分析一些问题,进步和前进的力量来自于质疑,并进行革新和再创造。

留存率这个数据指标不记得从何时起变得那么重要,重要到研发上把它作为游戏好坏的一个标准,运营商(平台)作为了一个准入的钥匙,是否值得继续下去。有时候觉得粗暴,甚至无知了有点。因为肤浅的百分比背后隐藏着更多的金子,也可能是垃圾。

以上算是一点吐槽,更多潜在的问题这里不想累述,前几日写过一个关于的留存率是什么的文章,我想肯定很多人看过了,估计也都会用了,今天写的番外篇将从这个数据的统计源头说起,换个角度来看待这个留存率的问题。

留存率VS百分比

百分比是用于表达比例的,类似于一种标准化的表达,因为百分比的分母是100,换个较多想想这种表达消除了数量级上的差异,使不同数量级之间的数据可以进行比较,比如:

这里我们看到尽管上周和本周的收入数据相差了一个数据量级,但是在百分比上的表现只是差了10个百分点,能够更好的进行量化数据,这个意义上,是非常有用的,然而这里如果只是对比本周的强化收入环比上周少了10个百分点就断言本周的强化道具卖的不好,那我们就错了。

那么下面我们再来审视这张图:

 

这张图我们发现的规律其实和上一张是一致的,如果我们只是在单纯的考察留存率,遇到的分析麻烦就是错误的相信了百分比,但是这里不能忽略百分比的作用。因此考察留存不是单纯的就在看留存率,你还要看到DAU,其后的留存,DNU规模等等信息。之所以要跟这个百分比较劲的原因其实很简单,你不能看到今天的DAU比昨天的DAU多了一倍,就说今天的DAU好于昨日,玩家更加积极(探寻有价值的DAU)。

留存率VS漏斗

大概我们现在在做留存分析都会用漏斗模型,因为一批用户进入游戏后,随着时间上是不断递减的,从玩家的游戏生命进程的确是这样的,然而这里面却存在了一个问题,这个漏斗不一定是个严格意义的漏斗。再来看上面的那张图,你会发现2日的留存率高于次日飞留存率,这里这种情况是存在的,实际的数据中也是存在的,至于原因后面会具体的来讲述。

留存率VS目的

我觉得用到留存率的目的是探寻一批用户的导入质量情况(包括游戏前期的成长等),或者是市场、渠道的质量研究,进而方便我们后期的调整投放策略,游戏改进方案。大概因此我们建立了留存率,作为一种转化率机制,来确定和为我们之前的目的服务。留存率是研究固定群体的转化情况,换句话我们是希望看到这个群体自然的变化情况,由于存在统计上时间滞后性,往往不小心就会带来错误。比如8月1日的次日留存在8月2日统计出来,3日留存在8月4日统计出来,7日留存在8月8日统计出来,但是如果我们够认真就会出现以下飞乌龙,比如8月2日统计的8月1日留存会错误的认为是8月2日的次日留存率。出现这个问题的原因就是统计日展现的数据不是统计日的,这点很多人在使用一些系统都会出现这样的问题。

其实费了不少话,最终要说的就是在下面这张图上:

此图中,我们列出来了每日新登玩家的次日、3日、7日的留存率,我们会发现每个固定的群体(每日新登作为一个独立的群体)次日、3日、7日的留存表现趋势基本上是相同的,也就是说,留存率的指标能够揭示一个群体在一段时间内的变化特征,且这种特征不会因为时间的变化而发生显著性改变。比如第37日的新登用户的次日、3日、7日留存表现都是保持一个趋势,这从某个角度来说,新玩家的期待或者特征我们游戏给予了最好的反馈,而这样的期待或者特征就是我们留存率使用起来的价值。(此处另外一种方式可以计算相邻两日留存率变化百分比,绘制曲线去分析这种趋势变化)

后记:

有关于留存的分析,留存率只是整体留存分析的很少一部分,真正挖掘留存的价值其实还要做很多工作,留存分析也不只是新用户的专利,比如充值用户的留存,这里没办法展开说。而一些留存率分析方法其实很多,这取决于我们分析的维度和角度,也许有时候你可以尝试一下做一个显著性分析,看看两个服务器的一段时间的留存变化是否显著,也许你也可以针对同时间的两个服务器的用户做分析,或者是不同渠道或者市场的用户分析,维度方式很多了,关键在于是否愿意去做。

其次,我一段时间以来一直使用几何平均数去处理这种“率”的概念,因为我们总要计算平均留存率,但是算数平均数不能屏蔽极端值的干扰,所以几何平均数是个很好的办法。

最后刚才提到一个关于漏斗的问题,这里我想把我的理解说一些,漏斗是作为一种分析转化率的形象化描述,但是在狭义的漏斗分析观念上(比如网站分析),我们的漏斗分析是针对一个session(一个会话期间)进行的转化率分析。然而我们这里的漏斗分析其实是一种广义上的转化率漏斗分析模式,即新登用户在次日登录了,那么在2日,3日,4日都可以登录,这里面不存在会话的,而狭义的漏斗是一个不断筛选的过程。因此这里的留存率是存在我们看到的3日大于次日的情况(这点在最后一部分中已经做了解释和说明)

相关文章
|
SQL 安全 数据挖掘
【业务数据分析】—— 用户留存分析(以挖掘Aha时刻为例)
【业务数据分析】—— 用户留存分析(以挖掘Aha时刻为例)
720 0
|
数据挖掘
小白学数据分析----->什么才是留存率的关键?
最近花了很多的时间在体验各种游戏,从火爆的卡牌,到策略,RPG等等,有一个问题在影响我,什么才是留存率的关键?今天就先讨论一些我的想法。 留存率已经成为大家最常提到的词汇,也是拿出来show一下的武器,不过一个困扰的问题在于,什么影响了留存,怎么优化留存。
1096 0
|
数据挖掘
小白学数据分析----->留存率与运营活动分析_I
有关留存率的事情最近扯得比较多,因为在分析数据的时候,越发觉得,分析一定是要来解决问题的,留存率不知何时突然变得流行了,在此讨论留存率倒不是因为流行,而是觉得以留存率为核心,的确是可以帮助我们解决不少的问题,但前提是,不要只停留在你所知道的次日,3日,7日留存率就OK,因为纵然你知道与benchmarks是差距,如果只抱着这个指标,你依然不知道自己该怎么做。
1071 0
|
数据挖掘 UED
小白学数据分析----->留存率使用的窘境_I
随着移动游戏整体的火热,现在看到太多的数据,太多信息,很多时候我们仰慕和钦佩别人的成功,我们总是把这个行业达成所谓共识的一些数据来出来说明问题。因为我们笃信数据是有力的证据,并且可以说明实力。然而太多的时候,因为沾染了更多的外在气氛,以至于在一些情况下看不到自己接下来的清晰的方向。
1104 0
|
数据挖掘 开发者
小白学数据分析----->留存率的三个普适原则
关于留存率的文章,现在很多,以下要说的内容实际上算是对于留存率使用的一个小归纳。这篇文章所要阐述的内容其实早在去年就已经形成了,一直没有足够的时间组织起来,因为我觉得虽然简单,不过影响的范畴和可扩展的领域很多。
1072 0
|
数据挖掘
小白学数据分析----->留存率分析_I[次日留存率突然下降了50%?]
最近在做留存分析时,遇到了不少的情况,也经常会有人问我,为什么我的游戏突然次日留存率降了一半。如果留存率是单单作为一个简单的指标的话,那对你价值还是蛮有限的,今天就和大家说说一个case,这是不久前解决掉的问题,相信会帮助不少人。
1305 0
|
新零售 数据挖掘
小白学数据分析----->留存率是什么?
篇外话 前段时间比较忙碌,小白系列也因此停了一段时间,这期间做了不少分析,发现和总结了不少经验,自己觉得还是很有用,不过倒都是一些基础的东西。最近很多人都在问一些基础术语和计算方式,我懂得不多,在此也想分享一下。
1086 0
|
算法 数据挖掘 数据采集
小白学数据分析----->在clementine基于两步聚类算法的次日留存分析探索
上次简单的说了一下SPSS下使用两步聚类分析的大致过程,今天简单说说在Clementine下怎么进行聚类分析,方法同样是两步聚类。 之前说过聚类分析是无指导的,揭示的输入字段集的模式,不是一种预测。在我们输入的字段上进行聚类分析找出组合最佳,能够反映共同属性的模式。
1119 0
|
3月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
77 2