小白学数据分析----->ARPPU的误区

简介: 新年到来,该应该持续坚持写下去,还是有很多人要来学习和进步的。 今天提到了一个概念:ARPPU。 这个概念等同于之前大家认识的ARPU(其实这句话我是很不愿意说的),ARPPU是总收入除以总付费用户数,得到的每个付费用户的平均收益。

新年到来,该应该持续坚持写下去,还是有很多人要来学习和进步的。

今天提到了一个概念:ARPPU。

这个概念等同于之前大家认识的ARPU(其实这句话我是很不愿意说的),ARPPU是总收入除以总付费用户数,得到的每个付费用户的平均收益。今天说的误区其实也就是大家一个使用上或者是认识上的误区,这个误区被巧妙的利用了,以至于那些可能不会注意到细节的人被蒙蔽了。

ARPPU是一个算数平均数,在均数的范畴中,概念很大,比如几何平均,截尾平均,调和平均(主要用于在玩家升级的平均速度方面的应用)等等。而恰恰因为ARPPU是算数平均数,所以,一些使用上的误区或者认识是需要背去校正的。

算数平均数是描述数据分布的集中趋势的统计指标,但是如果数据分布严重的偏态,那么这个时候算数平均数算出来的结果其参考意义是有限的。从ARPPU来讲,我们希望通过ARPPU的计算能够代表整个付费群体的平均消费水平和收入贡献,也是集中消费的趋势。但,对一款游戏而言,事实上并不是如同我们考虑的那般呈现所谓的正态分布形式,其实,如果我们把每人收入贡献绘制成频数分布来看,这是一个典型的幂律分布。小额付费群体多,但收入贡献少,大额付费群体少,但贡献收入多。而这时如果合并一起进行ARPPU的计算,显然高估了小额群体的付费能力,低估了大额群体的消费能力。

从集中趋势分析的角度来看

其实,多少年来,不是非常懂得精细化运营的人都是这么粗略的看待这个指标进行分析的,而现在对于这样一个使用误区,尤其当我们进行精细化运营后,需要更多的是跟多的群体细分,群体定位。当然,如果我们要从宏观把控整个游戏的平均消费水平,一种办法是去掉一些噪声,比如截尾均数(按比例去掉两端数据,在计算均数,如果和原来的均数相差不大,则说明极端值不存在,均数不受影响,一般是取5%),除了这种方法,这里我们可以通过一种非常简单的统计指标来分析,这就是中位数。

中位数:全体数据按大小排列,在数列中处于中间位置的那个值。中位数主要是位置平均数,所以不会受到极端值的影响,因此在评估ARPPU这类衡量平均水平,但是偏态分布严重的情况,中位数是很合适的,更加能够代表其集中趋势和平均水平。

从离散趋势分析的角度去看

百分位数

我们知道游戏中付费用户群体我们划分为三个部分,小鱼用户,海豚用户,鲸鱼用户,三个群体我们可以通过对总的付费群体进行百分比划分,这里就是用了百分位数据,所谓百分位数就是一个位置指标,我们可以把所有玩家的付费额从小到大排列,然后按照百分比划分,比如从左向右50%为小鱼,40%为海豚,10%为鲸鱼。在此情况下,我们分别计算各个群体的ARPPU值,这个相对我们刚才的从宏观的得到ARPPU,会更加准确的分析不同群体用户的消费能力。实际上刚才说到的中位数其实就是一个特殊的百分位数。

当然了,从离散趋势分析的角度,全距也都是可以去使用的,也是很简单的,这个只是一种检查而已,但是就方差,标准差等可能并不适合在游戏中消费数据的分析,虽然说他们涉及我们要分析的每个变量,但是由于他们也受到极端值的影响,所以不适合去做这种分析,他们的合理使用范畴是在服从正态分布的数据中。

总的来说,一个ARPPU所代表的内容很多,但是我们在使用和分析中,要避免一些误区产生。也要适当的使用统计学的一些灵活的方法重新审视和分析这些数据。

 

相关文章
|
监控 JavaScript 测试技术
从单体应用迁移到微服务的最佳实践
【8月更文第29天】随着软件架构的发展,越来越多的企业开始考虑从传统的单体应用迁移到微服务架构。虽然迁移可以带来诸如更好的可扩展性、更高的灵活性等优势,但这一过程也可能充满挑战。本文将详细介绍如何顺利地进行这一转变,并提供一些实用的步骤和示例代码。
385 1
|
3月前
|
人工智能 安全 语音技术
幼师必备AI教学神器:AI大模型赋能幼儿园课堂
输入幼儿年龄、性别、个案情况概述等关键内容,一键快速生成五大领域评价、幼儿发展评价、幼儿区域活动评价、幼儿游戏评价等评价内容,助力教师高效科学开展幼儿评价工作。
|
11月前
|
Linux 开发工具 Android开发
FFmpeg开发笔记(六十)使用国产的ijkplayer播放器观看网络视频
ijkplayer是由Bilibili基于FFmpeg3.4研发并开源的播放器,适用于Android和iOS,支持本地视频及网络流媒体播放。本文详细介绍如何在新版Android Studio中导入并使用ijkplayer库,包括Gradle版本及配置更新、导入编译好的so文件以及添加直播链接播放代码等步骤,帮助开发者顺利进行App调试与开发。更多FFmpeg开发知识可参考《FFmpeg开发实战:从零基础到短视频上线》。
1100 2
FFmpeg开发笔记(六十)使用国产的ijkplayer播放器观看网络视频
|
测试技术 数据安全/隐私保护 Docker
Docker部署开源项目Django-CMS企业内容管理系统
【5月更文挑战第20天】Docker部署开源项目Django-CMS企业内容管理系统
409 1
|
存储 自然语言处理 Python
Python中文词汇与英文词频统计
本文介绍了如何使用Python进行英文和中文词频统计。对于英文,借助内置库按空格分隔单词并处理特殊字符;对于中文,需安装jieba分词库。代码实现中,通过读取文件、分词、统计词频并输出到文件。运行时,通过命令行提供文本和结果文件路径。此技能在学术研究、语言分析和文本挖掘领域颇有价值。
Python中文词汇与英文词频统计
|
机器学习/深度学习 编解码 自然语言处理
重磅!新增 13 种 Transformer 方法,火速收藏
如今,Transformer 这把火已经烧到了计算机视觉领域,可以说成为今年最大的热点。本着全心全意为社区服务的精神,OpenMMLab 当然不会对此无动于衷。 为了方便大家研究学习,我们基于 MMCV ,在OpenMMLab 6个方向的 repo 中复现了 13 种基于 Transformer 的方法,快来看看有没有你需要的吧。
992 0
重磅!新增 13 种 Transformer 方法,火速收藏
|
分布式计算 Hadoop Linux
找到Hadoop的安装目录
【4月更文挑战第19天】具体的安装目录可能因您的安装方式和环境而有所不同。如果您在安装Hadoop时遵循了特定的教程或文档,建议参考该教程或文档中的安装目录信息。
427 3
|
SQL 分布式计算 Hadoop
利用Hive与Hadoop构建大数据仓库:从零到一
【4月更文挑战第7天】本文介绍了如何使用Apache Hive与Hadoop构建大数据仓库。Hadoop的HDFS和YARN提供分布式存储和资源管理,而Hive作为基于Hadoop的数据仓库系统,通过HiveQL简化大数据查询。构建过程包括设置Hadoop集群、安装配置Hive、数据导入与管理、查询分析以及ETL与调度。大数据仓库的应用场景包括海量数据存储、离线分析、数据服务化和数据湖构建,为企业决策和创新提供支持。
1619 1
|
数据可视化 编译器 程序员
【好一朵美丽的玫瑰花】(C++代码实现+EasyX图形化界面)
【好一朵美丽的玫瑰花】(C++代码实现+EasyX图形化界面)
231 0
|
机器学习/深度学习 编解码 算法
【YOLO系列】YOLOv2论文超详细解读(翻译 +学习笔记)
【YOLO系列】YOLOv2论文超详细解读(翻译 +学习笔记)
1821 0
【YOLO系列】YOLOv2论文超详细解读(翻译 +学习笔记)