数据挖掘应用案例:RFM模型分析与客户细分-阿里云开发者社区

开发者社区> 大数据> 正文

数据挖掘应用案例:RFM模型分析与客户细分

简介:

会员的价值体现在持续不断的为企业带来稳定的销售和利润,同时也为企业策略的制定提供数据支持。所以零售企业总是想尽一切办法去吸引更多的人成为会员,并且尽可能提高他们的忠诚度。忠诚度高的顾客表现为经常光顾购买,有较高的价格忍耐度,愿意支付更高的价格,也愿意向其他人推荐,对品牌满意度较高等。会员忠诚度高不一定会员价值就高,还得看他的实际消费金额,也就是消费力。忠诚度高、消费力强的顾客才是企业最优质的会员顾客。由于会员价值中“愿意向他人推荐”这个项目不好采集数据来量化,满意度也需要专项调查才能取得数据。所以结合这些特点,我们可以从以下几个指标去评估会员的综合价值:

1、最近一次消费时间理论上来讲,上一次购买时间距离现在越近的顾客价值越大。而他们得到营销人员眷顾的机会也应该大于那些很久没有光顾的顾客。当一位已经半年没有光临的顾客上周再次产生购买,那他就激活了自己的这个指标,所以最近一次消费时间是实时变化的,所以我们需要不断的激活顾客消费。

2、(某个周期内的)消费频率消费频率越高的顾客忠诚度越大,我们需要不断的采取营销手段去提高每个顾客的消费频率,这也是提高销售额非常有效的方法。一个产品没有重复购买的企业是非常危险的,意味着他的顾客都是新的,都是一锤子买卖。不光传统零售,现在重复购买率也是衡量一个电商网站的关键指标。消费频率最高的这部分顾客应该是得到企业关爱最多的群体,需要注意的是数据库营销不能过度营销,要以不骚扰用户为原则。

3、(某个周期内的)消费金额消费金额越大,顾客消费力也越大,在二八法则中,20%的顾客贡献了80%的销售额,而这些顾客也应该是得到营销资源最多的顾客。特别是当你的促销活动的费用资源不足的时候,这些高端的顾客就是你的首选对象。这个指标还需要和消费频率结合起来分析,有的顾客消费金额非常高,但是他可能只是购买了一次高单价商品,就再也没有光临过了。

这三项指标是著名的顾客价值研究的RFM模型,分别是R-Recency(最近购买时间),F-Frequency(消费频率),M-Monetary(消费金额)。这三个指标来自于美国数据库营销机构的研究,现在逐渐成为会员价值研究以及会员营销的通用模型了。

这里的RFM模型和进而细分客户仅是数据挖掘项目的一个小部分,假定我们拿到一个月的客户消费行为数据集(实际上有六个月的数据),我们们先用IBM Modeler软件构建一个分析流:

640?tp=webp&wxfrom=5 我们先用挖掘工具的RFM模型的RFM汇总节点和RFM分析节点产生R(Recency)F(Frequency)M (Monetary)

640?tp=webp&wxfrom=5 接着我们采用RFM分析节点就完成了RFM模型基础数据重构和整理;

640?tp=webp&wxfrom=5 现在我们得到了RFM模型的Recency_ScoreFrequency_ScoreMonetary_ScoreRFM_Score;这里对RFM得分进行了五等分切割,采用100101加权得到RFM得分表明了125RFM魔方块。

传统的RFM模型到此也就完成了,但125个细分市场太多啦无法针对性营销也需要识别客户特征和行为,有必要进一步细分客户群;

另外:RFM模型其实仅仅是一种数据处理方法,采用数据重构技术同样可以完成,只是这里固化了RFM模块更简单直接,但我们可以采用RFM构建数据的方式不为RFM也可用该模块进行数据重构。

接下来,我们继续采用挖掘工具对RFM三个字段进行聚类分析,聚类分析主要采用:KohonenK-meansTwo-step算法。

这时候我们要考虑是直接用R(Recency)F(Frequency)M (Monetary)三个变量还是要进行变换,因为RFM三个字段的测量尺度不同最好对三个变量进行标准化,例如:Z得分(实际情况可以选择线性插值法,比较法,对标法等标准化)!另外一个考虑:就是RFM三个指标的权重该如何考虑,在现实营销中这三个指标重要性显然不同!

有资料研究表明:对RFM各变量的指标权重问题,Hughes,Arthur认为RFM在衡量一个问题上的权重是一致的,因而并没有给予不同的划分。而Stone,Bob通过对信用卡的实证分析,认为各个指标的权重并不相同,应该给予频度最高,近度次之,值度最低的权重;

这里我们采用加权方法:WR=2 WF=3 WM=5的简单加权法(实际情况需要专家或营销人员测定);具体选择哪种聚类方法和聚类数需要反复测试和评估,同时也要比较三种方法哪种方式更理想!

下图是采用快速聚类的结果:

640?tp=webp&wxfrom=5 以及kohonen神经算法的聚类结果:

640?tp=webp&wxfrom=5 接下来我们要识别聚类结果的意义和类分析,这里我们可以采用C5.0规则来识别不同聚类的特征,采用评估分析节点对C5.0规则的模型识别能力进行判断:640?tp=webp&wxfrom=5 结果还不错,我们可以分别选择三种聚类方法,或者选择一种更易解释的聚类结果,这里选择Kohonen的聚类结果将聚类字段写入数据集后,为方便我们将数据导入SPSS软件进行均值分析和输出到Excel软件!

输出结果后将数据导入Excel,将RFM三个字段分类与该字段的均值进行比较,利用Excel软件的条件格式给出与均值比较的趋势!结合RFM模型魔方块的分类识别客户类型:通过RFM分析将客户群体划分成重要保持客户、重要发展客户、重要挽留客户、一般重要客户、一般客户、无价值客户等六个级别;(有可能某个级别不存在);

另外一个考虑是针对RFM三个指标的标准化得分按聚类结果进行加权计算,然后进行综合得分排名,识别各个类别的客户价值水平;

640?tp=webp&wxfrom=5 至此如果我们通过对RFM模型分析和进行的客户细分满意的话,可能分析就此结束!如果我们还有客户背景资料信息库,可以将聚类结果和RFM得分作为自变量进行其他数据挖掘建模工作!

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
大数据
使用钉钉扫一扫加入圈子
+ 订阅

大数据计算实践乐园,近距离学习前沿技术

其他文章