这是数据分析实战的第三篇(复购率计算篇),本文提供真实数据(脱敏),并梳理复购率计算思路和技巧,通过15分钟的阅读和实践,读者即可根据自己的订单数据灵活计算业务涉及到的复购率了。(实战数据在文末)
相关核心技巧:辅助列,数据透视表
ONE:什么是复购率?
对于销售尤其是快消品销售来说,不论线上还是线下,复购率这个指标都是重头戏,你说你的产品粘性很强,他说他的会员营销做的OJBK,我说我的内容营销对客户维系作用非常棒。
谁说了算?
复购率说了算!
我们先明确一下复购率的定义,官方说法(百科介绍):指消费者对该品牌产品或者服务的重复购买次数,重复购买率越多,则反应出消费者对品牌的忠诚度就越高,反之则越低。
粗读概念总是模糊的,提炼一下,复购率就是一段时间内,购买2次及以上客户人数,占总人数的比重。这一步提炼揭示了我们计算复购率需要确定的3个点——一是一段时间(这里就是一个月),二是统计购买2次和2次以上对客户数,三是复购人数占总客户数(去重)比重。
TWO:怎么计算复购率?
第一步:数据概览
做数据分析,拿到数据后先撸(粗略看一下)一遍数据是一个极好的习惯,
我们从三个角度(订单数量、是否存在脏数据、数据逻辑)来看,不难发现:
1、实战数据一共有61072笔订单,时间涵盖了2018年7月1日-2018年7月31日,为期一月。
2、复购率计算是针对交易成功的客户,筛选交易状态,发现存在6088笔订单是用户退款,交易关闭了的,因此需要删除。
3、每一行数据只记录一个产品的交易信息,如单个客户一次性购买3个产品,系统会生成3笔(3行数据)订单信息。
第二步:数据清洗
我们先对刚才的脏数据(退款订单)进行清洗,这一列主要是和“交易状态”列相关的,选中该列,点击“排序和筛选”,
然后勾选中“付款以后用户退款成功,交易自动关闭的订单”:
样筛选出了所有脏数据,选中他们,
按一下“DELETE”键,和脏数据说拜拜,但是,刚才脏数据占据了很多行,现在这些行空了出来,将数据分的七零八落,为了规整数据,我们必须删除所有空行。
思路:通过定位某一列所有空单元格,再删除空单元格所在行即可:
选中A列,按住"CTRL+G",点击“定位条件”,选中“空值”:
这时我们已经选中了A列所有单元格,把鼠标移动到其中选中的一个,右键删除,然后选择“整行”,
至此,简单的数据清洗已经完成。(部分同学反映这次数据有点给力,有些操作可能会耗些时间,大家耐心等待)。
第三步:计算复购率
再次重申一下,从系统导出的订单,绝大多数情况,同一个客户购买了多个产品,会生成多笔订单(下单、付款时间几乎一致),更进一步,一个客户在一天内购买多次,比如上午9:00下了一单,下午15:00又下了一单,时间存在不一致,但从消费行为上看,算复购并不合理,我们在此定义,单个客户1天内下的多笔订单,不能算复购。
因此,要计算复购,需要对同一天的多笔订单进行去重,思考30秒。
有思路了吗?
辅助列是个好东西,重要的话说三遍:辅助列好,辅助列秒,辅助列它棒的呱呱叫。
一个用户在同一天下单时间一般是这样的“2018/6/1 00:12:12”,年月日时分秒的格式,如果我们用年月日来进行识别,是不是同一天内下单对多笔订单就能够去除呢?
Let's do it,先插入一列:输入YEAR()&MONTH()&DAY(),
公式的意思就是获取年份,月份,一个月第几天并合并成一个数据),接着就是去重,我们为了让“同一天内多次下单的客户算作一次购买”,把“买家会员名”和辅助列(标志用户哪一天购买)两个字段作为判断标准,进行去重。
操作:所有列,找到”数据“模块下的”删除重复项“选项卡,
记住,买家ID和辅助时间列两列都勾选,就是买家ID和时间辅助列都一样的情况下才会删除
至此,我们已经把同一天内重复购买的客户订单完全剔除掉了。
(注:这里单纯计算复购率,因此采用了比较粗暴的删除方式,以后将会介绍更好的方法。)
下面一步的关键是要统计所有用户的购买次数,数据透视表蠢蠢欲动了。
选中所有数据,插入数据透视表,我们想要得到每个客户的复购次数,所以把“买家ID”放在透视表的”行“里面,再把”买家ID“放在值里面,用计数的格式显示,就得到了每个客户的复购次数。
数据透视表显示区域是这样的:
后,我们只要统计出购买次数大于等于2次的人数,再用他们除以总人数,复购率就出来了。
用COUNTIF(区域,条件),选中数据透视表“买家ID”这一列,统计条件是“>=2",
结果是4628,再用COUNT统计总人数
可以发现,这段时间(7月份)的复购率就是16.93%(4628/27343),抛开产品和用户谈评价复购率高低就是耍流氓,这里主要讲述一种基于订单数据的通用计算法则, 暂不对指标本身做评判和讨论,后续会更新关于具体分析思维的案例。
喏,我们知道了这个月的复购率是16.93%,也就是说,在这个月,100个客户中会有近17个客户重复购买。
等等,让我们再重新念一遍:“在这个月,100个客户中会有17个重复购买”,基于这个假设,也就是说1000个客户中平均会有170个客户,10000个里面平均有1700个会重复购买。那他们重复购买的行为是怎么分布呢?(购买2次的有多少,购买3次、4次等等各有多少呢?)
SO EASY~
刚才的数据透视表“计数项:买家会员名”这一列已经统计出客户在本月的购买次数,我们可以用COUNTIF公式稍加汇总即可:
看来,复购用户占比会随着复购次数的增加而减少,有复购行为的客户中,大部分(67.39%)是购买了2次的,购买3次的用户占比16.81%,4、5、6次如上表。
敲黑板,思路和逻辑比会使用工具本身更加重要。
我们拿到订单(最重要的是买家昵称,付款时间两个字段)数据,先明确分析的目的(复购率),然后进行清洗(去掉脏数据),再为了得到结果创造条件(为了避免一天内同一客户多次下单的干扰,我们插入辅助列并去重),最终利用数据透视表进行数据汇总,基于汇总的结果,轻而易举(借助COUNT和COUNTIF)算出了复购率和复购分布。
文末附上实战数据:
链接:pan.baidu.com/s/1mtYxKt 密码:ifyn