去伪存真——用数据分析手游渠道是否作弊

简介:   为什么这个渠道的数据很好,可就是不盈利呢?是我的产品有问题呢?或是渠道作弊?这还真是让人头疼。行业关于渠道作弊这块分享的信息真是太少了,各CP只能跌跌撞撞,靠自己摸着石头过河,那这回我们一起走进数据的世界,用数据说话,拨开迷雾辨真伪吧。
0.jpg

 

为什么这个渠道的数据很好,可就是不盈利呢?是我的产品有问题呢?或是渠道作弊?这还真是让人头疼。行业关于渠道作弊这块分享的信息真是太少了,各CP只能跌跌撞撞,靠自己摸着石头过河,那这回我们一起走进数据的世界,用数据说话,拨开迷雾辨真伪吧。

初级渠道作弊:同时看一次性用户指标/比例&平均单次使用时长指标

渠道的初级作弊,就是只拉新增用户,这种刷作弊的方式较容易发现,因为用户一次性用户指标较低,平均单次使用时长也远低于其它渠道均值,或是自身渠道其它的值。

笔者曾经遇到一个做手游的好友,他的产品投到新渠道后,新增用户连续3天暴涨500%,但是留存却不高,想咨询是什么地方有问题。于是我帮他查看了这个新渠道的两个指标:一次性用户指标&平均单次使用时长均低于其它渠道均值,基本上可以判断是渠道作弊了,再看新增用户的时间段,立马验证。正常用户都是在中午和晚上新增较多一个空闲的时间段,而这个增量正好相反,明显是一个上班的时间段(8:00-18:00)。

1.jpg

 如果你只投放了少量渠道,不能确定数据的时候,也可以对比TalkingData每月出的benchmark里的一次性用户比例&平均使用时长数据进行对比。

中级渠道作弊:看页面明细

一些手段稍微高一点的作弊,会将你应用中的SDK,打到别的热门应用中去,这样不但新增上去了,而且各项数据都还非常好看,没有破绽,但是就是盈利上不去。

这个时候就要需要关注页面明细了,查看页面明细是否是自家的,如果不是自家的页面,那这就很有可能存在作弊的问题。

2.jpg

高级渠道作弊:多数据维度比对

高级渠道作弊已经超出了一般人类可以想象的范畴,达到了智能级别,无论用户留存、机型、地域、联网等连手机号注册都可以作弊(笔者第一次知道的时候和小伙伴们都惊呆了。)以至笔者当时只能订了一个指标:LTV指标,如果这个指标达不到渠道平均水平,那么就放弃这个渠道,无论这个渠道是否作弊。但是后来随着对应用和渠道接触的越来越多,错杀了不少好渠道,觉得还是要多维度数据指标进行评判,TalkingData就有对这方面数据进行健康度评估。

3.jpg

如果要是游戏应用一般看用户玩家等级的比例就可以了,一般渠道是不会雇人去玩游戏升级的。

4.jpg

俗话说的好,道高一尺,魔高一丈,以上方法也不一定全面,如果还有别的分析渠道作弊的方法,大家多多分享出来。当然渠道作弊的情况还是比较少发生的,一般情况下如果应用数据不好,还是给从自己的应用中去找问题。

另附:

在实际推广中,App铺的渠道是非常多的,要从众多渠道中发现异常或者挑出不合适的渠道非常耗费人力,而且容易出错。所以这里分享一个游戏渠道数据打分模型,根据App设定当渠道高于X分的时候,要加大投放力度,当低于X分的时候,需要跟进该渠道,检查数据是否有异常或者是剔除不合适的渠道。这样可以节省不少人力,并提高排查准确率。这里引用一下游戏数据分析达人——石头曾介绍过“Z-score标准化”进行打分处理:

数据标准化“Z-score标准化”5.jpg

μ为样本均值(Excel中函数Average),σ为样本标准差(Excel中函数STDEV)。
标准化多纬度数据:

6.jpg

标准化之后接着来就是要想办法把数据变成5分制(也就是1分、2分、3分、4分、5分),这里是将X的套用分数如下:

7.jpg

而后根据你目前游戏目标,给不同指标加上权重汇总后,可以得到相应指标(同样这里建议样本数据不能低于5个,不然会影响数据准确性)。这种方法前期需要根据实际情况调整权重,剔除异常值,稳定后,模型使用将会非常快捷、准确、省力、方便。


原文发布时间为:2013-09-21

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号


相关文章
|
数据挖掘 开发工具 黑灰产治理
|
数据挖掘
小白学数据分析----->基于数据驱动的最佳渠道评估策略
对于游戏数据分析来说,我们要从很多方面下手,具体从数据分析角度来说,作为游戏CP需要作三块工作,第一是游戏推广,第二是游戏质量,第三是游戏运营,就这三点来看,推广是未来游戏是否有稳定人气,获得稳定收入的关键一环。
1072 0
|
监控 数据挖掘 开发者
小白学数据分析----->渠道、运营、数据_I
学分析论坛|专注于游戏数据分析 针对本文的相关的讨论,请移步http://www.xuefenxi.com/forum.php?mod=viewthread&tid=112&extra= 上周六做了一个演讲,关于渠道、数据、运营的内容,今天开始,针对演讲的一些内容,有针对性的阐述一下。
1001 0
|
16天前
|
数据采集 数据可视化 数据挖掘
深入浅出:使用Python进行数据分析
在这篇文章中,我们将探索Python在数据分析中的应用,介绍几个关键的库,如Pandas、NumPy、Matplotlib,以及如何使用它们进行有效的数据处理和可视化。本文旨在为初学者提供一个清晰、简洁的指南,让读者能够快速掌握使用Python进行数据分析的基本技能,并通过一个实例加深理解。不同于其他文章的冗长解释和复杂示例,我们将以最直接、易懂的方式,让你迅速上手,即使是完全没有编程背景的读者也能轻松跟上。
|
7天前
|
机器学习/深度学习 数据挖掘 计算机视觉
python数据分析工具SciPy
【4月更文挑战第15天】SciPy是Python的开源库,用于数学、科学和工程计算,基于NumPy扩展了优化、线性代数、积分、插值、特殊函数、信号处理、图像处理和常微分方程求解等功能。它包含优化、线性代数、积分、信号和图像处理等多个模块。通过SciPy,可以方便地执行各种科学计算任务。例如,计算高斯分布的PDF,需要结合NumPy使用。要安装SciPy,可以使用`pip install scipy`命令。这个库极大地丰富了Python在科学计算领域的应用。
12 1
|
8天前
|
数据可视化 数据挖掘 Python
Python中数据分析工具Matplotlib
【4月更文挑战第14天】Matplotlib是Python的数据可视化库,能生成多种图表,如折线图、柱状图等。以下是一个绘制简单折线图的代码示例: ```python import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.figure() plt.plot(x, y) plt.title('简单折线图') plt.xlabel('X轴') plt.ylabel('Y轴') plt.show() ```
12 1
|
8天前
|
数据采集 SQL 数据可视化
Python数据分析工具Pandas
【4月更文挑战第14天】Pandas是Python的数据分析库,提供Series和DataFrame数据结构,用于高效处理标记数据。它支持从多种数据源加载数据,包括CSV、Excel和SQL。功能包括数据清洗(处理缺失值、异常值)、数据操作(切片、过滤、分组)、时间序列分析及与Matplotlib等库集成进行数据可视化。其高性能底层基于NumPy,适合大型数据集处理。通过加载数据、清洗、分析和可视化,Pandas简化了数据分析流程。广泛的学习资源使其成为数据分析初学者的理想选择。
14 1
|
10天前
|
Python 数据挖掘 存储
Python 数据分析(PYDA)第三版(七)(4)
Python 数据分析(PYDA)第三版(七)
34 1
|
Python Shell 存储
Python 数据分析(PYDA)第三版(七)(3)
Python 数据分析(PYDA)第三版(七)
46 1
Python 数据分析(PYDA)第三版(七)(3)
|
机器学习/深度学习 数据可视化 Python
Python 数据分析(PYDA)第三版(六)(2)
Python 数据分析(PYDA)第三版(六)
56 0