百货商场用户画像描绘与价值分析(中)
构建会员用户业务特征标签
取DataFrame之后转置取values得到一个列表,再绘制对应的词云,可以自定义一个绘制词云的函数,输入参数为df和会员卡号
L: 入会程度(新用户、中等用户、老用户)
R: 最近购买的时间(月)
F: 消费频数(低频、中频、高频)
M: 消费总金额(高消费、中消费、低消费)
P: 积分(高、中、低)
S: 消费时间偏好(凌晨、上午、中午、下午、晚上)
X:性别
查看数据的基本特征
描述性统计
开始对数据进行分组
L(入会程度):3个月以下为新用户,4-12个月为中等用户,13个月以上为老用户
R(最近购买的时间)
F(消费频次):次数20次以上的为高频消费,6-19次为中频消费,5次以下为低频消费
M(消费金额):10万以上为高等消费,1万-10万为中等消费,1万以下为低等消费
P(消费积分):10万以上为高等积分用户,1万-10万为中等积分用户,1万以下为低等积分用户
保存数据
4.2 会员用户词云分析
开始绘制用户词云,封装成一个函数来直接显示词云
函数说明:
df: 为DataFrame的数据集
id_label: 为输入用户的会员卡号,默认为随机取一个会员进行展示
随机查找一个会员来绘制用户画像
5 会员用户细分和营销方案制定
5.1 会员用户的聚类分析及可视化
先对数据进行标准化处理
对数据进行聚类
构造一个绘制聚类可视化效果雷达图的函数
函数说明:
features: 字段名
clf_list:list,为聚类器列表
nrow: 图的行数
ncol: 图的列数
title: 图的名称
从上面可以看出,标准化后的数据聚类效果相较于归一化的更好,且从轮廓系数和聚类雷达图也可以看出,聚类数最佳为2。因此,下面我们使用聚类数为2的标准化数据进行聚类,得到两类客户的LRFMP均值数据,以此来判断两者之间的差异
5.2 对会员用户进行精细划分并分析不同群体带来的价值差异
以聚类数为2贴上对应的标签
统计一下两类用户之间的差异,发现两类客户之间数量相差过大
用均值来计算两类样本之间的LRFMP
从上面可以看出,标签为1的客户消费频次、消费金额和消费积分均远大于标签为0的客户,且这类客户所占的比例仅有2.3%,可以将其定义为“重要保持会员”。标签为0的客户所占比例为97.7%,其会员登记时间跟标签为1的比较接近,但最近一次消费时间较标签1的还要长,可以将其定义为“一般发展会员”