Pandas透视表及应用(一)+https://developer.aliyun.com/article/1543896?spm=a2c6h.13148508.setting.33.1fa24f0eyCLrzp
整体等级分布
报表可视化
从业务角度,将会员数据拆分成线上和线下,比较每月线上线下会员的运营情况
将“会员来源”字段进行拆解,统计线上线下会员增量
各地区会销比
会销比的计算和分析会销比的作用
会销比 = 会员消费的金额 / 全部客户消费的金额
由于数据脱敏的原因,没有全部客户消费金额的数据,所以用如下方式替换
会销比 = 会员消费的订单数 / 全部销售订单数
会销比统计的是会员消费占所有销售金额的比例
通过会销比可以衡量会员的整体质量
加载数据 custom_consume=pd.read_excel('data/会员消费报表.xlsx') all_orders=pd.read_excel('data/全国销售订单数量表.xlsx') custom_consume.head() all_orders.head()
为会员消费报表添加年月列
merge连接相当于SQL的join
剔除电商数据,统计会员购买订单数量:
全部订单数
计算各地区会销比
会员连带率分析
统计订单的数量:需要对"订单号"去重,并且只要"下单"的数据,"退单"的不要
统计消费商品数量
计算连带率
会员复购率分析
上面计算的数据为所有数据的复购率,我们要统计每年的复购率,所以要先对数据进行订单日期筛选,这里我们定义一个函数
统计2018年01月~2018年12月复购率和2018年02月~2019年01月复购率
计算2018年的复购率
计算2018年02月~2019年01月的复购率
计算复购率环比