流失客户预测及营销方案(源码)

简介: 流失客户预测及营销方案(源码)

1 赛题



2 赛题分析


2.1 赛题背景


随着科技发展,银行陆续打造了线上线下、丰富多样的客户触点,来满足客户日常业务办理、渠道交易等客户需求。面对着大量的客户,银行需要更全面、准确地洞察客户需求。在实际业务开展过程中,需要发掘客户流失情况,对客户的资金变动情况预判;提前/及时针对客户进行营销,减少银行资金流失。本次竞赛提供实际业务场景中的客户行为和资产信息为建模对象,一方面希望能借此展现各参赛选手的数据挖掘实战能力,另一方面需要选手在复赛中结合建模的结果提出相应的营销解决方案,充分体现数据分析的价值。


2.2 赛题分析与理解


通过对赛题的分析与理解,本次比赛的任务是:从用户各个季度的基本资料、资金情况及行为信息,建立客户的流失预警模型,挖掘客户流失的原因,辅助业务加强客户维护及营销,提高客户的粘度,减少客户/资金的流失。 本次建模的目标是根据用户前两个季度的历史数据,预测下一季度用户的标签(-1/0/1,标签存在递进关系)。问题转换成三分类问题,从1)aum_m(Y)、2)behavior_m(Y)、3)big_event_Q(Z)、4)cunkuan_m(Y)、5)cust_info_q(Z)表中构建特征,评估指标为Kappa,其本质的考量是分类一致性(准确)且无偏倚。


3 建模方案



3.2 特征工程


3.2.1 用户信息特征


数据源表:cust_info_q(第 Z 季度的客户信息) 数值型如家庭年收入,年龄等直接入模。发现不同标签下年龄分布差异较大。



类别型如性别、客户等级、职业等转换成类别变量入模。发现普通用户是最大流失客群。



此外,用户信息的完善程度可能会影响该用户的忠实程度,以此加工基本信息的缺失率特征。


3.2.2 资金情况特征


数据源表:aum_m(第 Y 月的月末时点资产数据)、 behavior_m(第Y月的行为数据)、 cunkuan_m(第 Y 月的存款数据):


主要加工存款、aum、动账金额的方差、平均值、增长率、最大值及最小值,并结合字段含义进行组合衍生。


其中,对各月存款C1,产品数目C2在不同标签下分布分析发现,高资金流水风险的用户整体存款额度/产品数目较低,且随时间有下降趋势。



3.2.3 时间特征


数据源表:behavior_m(第Y月的行为数据)、big_event_Q(第 Z 季度的客户重大历史数据)


big_event_Q(Z)主要为第一次转账、存款等日期,加工了距今及距离开户的日期间隔可以体现客户的活跃度;


behavior_m(Y) 季度末有最近交易日期,通过加工出交易的具体时间及周几等时间特征可以反馈用户的一些行为习惯。发现不通标签用户交易的时间分布差异较大,对具体小时做了(<10点、>12点、>14点)的离散化处理。



3.2.4 序列预测特征


本模块特征由于计算资源不足导致拟合效果差的原因,最终并无入模,但该方法考虑时间序列连续性预测未来资金情况,可作为本方案的一个小亮点。


考虑项目的标签定义与资金波动情况关系较大,本模块序列预测特征的思路是依据前几个月(如Q3季度作为训练样本)的历史资金数据用(LSTM或LGB)回归预测Q4季度资金情况,并将预测数值结果作为特征入模。


3.2.5 Featuretools组合特征


Featuretools是一个自动特征衍生的开源库,主要使用转换及聚合的方法自动特征衍生,以补充人为特征衍生的不足。



我们首先通过lightgbm训练并选择的是split及gain的重要性top150的人工衍生特征,再通过Featuretools 两两做乘法/除法做出特征交互特征。考虑Featuretools组合的变量噪声较多,最终由模型选择Top300的Featuretools重要特征入模。


3.3 特征选择


特征选择的主要方法有: 1)筛选法: 皮尔森相关系数(衡量变量间的线性相关性)、缺失率及单值率等情况; 2)包装化: 特征集多次(前向/后向)迭代寻找最优子集。 3)嵌入法: 通过如LGB模型选择特征重要性较高的特征。 考虑计算资源有限,本方案采用的是:筛选法初筛后,进一步通过嵌入法由模型选择重要特征。这种方法较为高效,因为模型学习的过程和特征选择的过程是同时进行的。


3.4 模型训练


LightGBM(Light Gradient Boosting Machine)是一个实现GBDT算法的框架,支持高效率的并行训练,并且具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据且支持类别型变量等优点。 基于衍生出的特征,包含原始特征及类别特征共有 1211 维特征,以此训练Lightgbm,借助Bayes方法调参,单模型验证集Kappa值为 0.49 左右(线上测试集Kappa 0.475左右)。


3.5 模型融合


受bagging 思想的启发,我们通过对训练集5次的随机抽样(抽样比例70%),随机列抽样,并用Bayes优化选择子模型,最后得到5个lgb子模型进行bagging。这个方法在参数和特征上都引入了多样性(差异性),使得最后bagging的泛化效果有较大的提升,OOT测试集Kappa 0.483左右。




3.6 建模过程中的发现与创新点


1)总结了用户画像:特征加工过程中我们总结了高流失用户的用户画像:



2)特征设计了序列预测特征:考虑了时间序列连续性,预测未来资金情况,并将预测数值结果作为特征。


3)模型易部署:最终模型使用5个Lightgbm做均值融合,模型结构不复杂易部署,并取得线上Kappa 0.483的效果。


4 营销方案


4.1 客户流失综合原因分析


现在银行产品同众化现象普遍存在,客户选择产品和服务的途径越来越多,客户对产品的忠诚度越来越低,而获得新客的成本远高于维护老客户成本。所以客户流失已经成为银行业最关注的问题之一。客户流失原因可以分为两类:


第一类非主观意愿缺失。如破产、工资卡变化等。


第二类是需求未满足。原因比较复杂,如产品营销活动少、产品利率较低、业务体验差、客户自身的需求变化、竞争对手的策略、国家政策等。




结合模型对客群流失的特征(Shap值)分析,对客户流失的贡献度较高的特征为:存款金额少、存款产品少、AUM低、年龄较小等。综合原因可能为产品缺乏竞争力、活动较少、未重视年轻客群等。我们建议可以采取相关的措施,如:加强客户关系维系、差异营销、扩大销售、更多营销活动等。


(注:本节流失原因分析从建模技术层面分析,这无疑是比较片面的。具体原因可以从考虑到宏观政策变化、营销活动等因素分析其流失趋势情况,并通过流失客户资金流向情况分析加于佐证。)


4.2 营销策略


4.2.1 客群划分


商业银行客户数量庞大,而银行自身资源也是比较有限的,考虑成本效益原则,我们需要重点关注的是具有流失倾向且高质量客户,由此我们首先做两步的客群划分:


第一步:借助流失预警模型我们可以将客户的流失倾向分为3类:高流失风险客群(-1),低流失风险客群(0),稳定客群(1)。



第二步:按客户质量通常可大致分为以下三类:低价值客户、有价值客户及高附加值客户。我们可以综合行内客户等级、Aum值、最近一次消费间隔、消费频率、消费金额、金融产品数目、金融产品金额以及未来价值(通过该序列回归预测模型预测未来AUM值)这几个维度指标去考量,具体划分客群质量我们有两种方式:


方法一:分别对以各维度指标客户排名分布情况(如:各指标的80分位点作为参考阈值),划分价值客户。各维度指标具体划分的阈值可参考业务建议。



方法二:以各维度指标作为特征,归一化后采用聚类方式建模划分K个客群,并以各客群的中心值表现,定义划分出客群的价值类别。



4.2.2 整体客户管理策略


综合流失风险及质量属性划分客群后,对不同类型客户制定不同的营销策略:




4.2.3 重点客户管理策略


在此细分结构下我们重点关注高价值/附加值客户的流失风险客户,并根据其需求为其量身定制相应的营销方式:


1)借助用户画像了解其特点,提供个性化服务及优惠政策。如:提醒参加营销活动、提高贷款授信额度等;


2)通过建立营销推荐模型,交叉销售更多优质的产品;


3)建立专属客户经理机制,以客户响应良好的营销途径(如电话营销)及用户问卷调查。



5 思考与展望


5.1 关注客户生命周期并智能营销


需要关注的是,当客户处在不同的生命周期阶段时,需要满足不同的需求。结合客户生命周期管理促进我们纵向深入的了解每一类型客户并做量化管理,通过针对处于不同客户生命周期阶段的客户的区别对待,实现企业资源的最优配置。



5.2 其他营销要点


5.2.1 营销时间点等偏好


挖掘客户的手机app登录、动账、购买理财产品等行为的活跃时间段,参考每个客户的活跃时间段,针对性地发送营销短信。


5.2.2 洞察客户需求


获取更多类型(参与活动、理财习惯)数据,评估客户的兴趣偏好,推荐适合客户的营销产品。


项目路径:流失客户预测 欢迎star及fork 算法进阶github博客~


相关文章
|
29天前
|
人工智能 搜索推荐 安全
打造精准营销!营销电子邮件以客户为中心策略解析!
营销电子邮件是数字营销的核心,用于建立客户关系、推广产品和服务,提高品牌忠诚度和转化率。它们在客户旅程中扮演关键接触点角色,如欢迎邮件、购物车提醒和个性化推荐。电子邮件营销能提升品牌知名度,细分营销可带来760%的收入增长。然而,大量邮件可能导致邮件过载,缺乏个性化可能引起收件人反感,甚至网络安全问题。收件人和IT团队可通过过滤、优化设置、启用2FA等措施改善体验。营销团队则需克服管理、个性化和法规遵从等挑战,采用先进技术同时确保隐私和安全,以同理心驱动的策略建立客户连接,实现业务成功。
21 1
打造精准营销!营销电子邮件以客户为中心策略解析!
|
1月前
|
人工智能 搜索推荐 大数据
客户营销是什么意思?
客户营销是什么意思?
|
1天前
|
JavaScript Java 测试技术
基于Java的江苏融汇房地产营销策划有限公司的宣传网站的设计与实现(源码+lw+部署文档+讲解等)
基于Java的江苏融汇房地产营销策划有限公司的宣传网站的设计与实现(源码+lw+部署文档+讲解等)
9 0
基于Java的江苏融汇房地产营销策划有限公司的宣传网站的设计与实现(源码+lw+部署文档+讲解等)
|
29天前
|
存储 监控 搜索推荐
营销管理利器!客户管理软件如何助力您实现精准营销管理?
使用CRM软件能助力企业提升营销效果和客户管理。通过统一客户信息平台,深度分析客户行为,实现个性化营销和预测性营销,提高营销转化率。同时,优化客户服务体验,增强多渠道沟通,提升客户满意度和忠诚度。营销自动化功能则能提高工作效率,精准投放资源,降低营销成本。Zoho CRM作为强大的工具,对于各阶段企业都是提升竞争力的关键。
12 1
|
29天前
|
监控 搜索推荐 数据挖掘
如何利用客户管理软件实现精准获客?精准获客营销工具大揭秘!
本文探讨了如何使用CRM软件进行精准获客,强调了客户数据集成分析、精准定位与个性化营销及跟踪优化的重要性。CRM系统帮助构建全面客户数据库,挖掘深层洞察,制定精准策略;定位目标群体,设计个性化营销活动,利用自动化工具提升效率;同时,实时跟踪营销效果,深入分析ROI并持续优化策略。Zoho CRM作为工具,助力企业提高获客效率和营销ROI。
15 1
|
5月前
|
机器学习/深度学习 人工智能 监控
如何利用AI实现银行存量客户的营销?
金融行业是当今大数据、人工智能应用最广、最深的领域之一。随着数据仓库和数据科学的发展,以银行为代表的金融行业企业拥有了海量数据,应运而生了金融领域的大数据分析、智能营销等大数据和人工智能的应用。其中针对存量客户的智能营销成为银行业的一项重要策略。
|
2月前
|
监控 数据可视化 前端开发
高效设计企业营销系统的3种方案实践复盘
高效设计企业营销系统的3种方案实践复盘
33 2
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
银行营销定制方案:大模型赋能,提升存量客户业务效益近30倍
随着科技的进步和数字化趋势的加速,作为典型知识密集型行业的银行业正面临着前所未有的挑战和机遇。在这个过程中,大模型因为相较传统机器学习有着更强的长文本处理能力,通过海量训练可以形成知识洞察和智能涌现能力,这种独有的能力正在发挥着越来越重要的作用。特别是在存量客户营销方面,大模型正在改变传统营销模式,提供更加精准、个性化的服务,帮助银行更好地满足客户需求,提升客户满意度和忠诚度。
|
11月前
|
SEO
如何用ChatGPT做内容营销方案和选题计划,同时生产和优化内容?
该场景对应的关键词库(31个): 内容营销、目标、主题、类型、选题计划、素材、推广策略、优化方案、渠道、目标受众、竞争对手、行业背景、转化率、品牌知名度、客户参与度、销售、发布频率、选题阶段、生产阶段、推广阶段、预算分配、人群特征、话题标签、视觉元素、电子邮件、SEO、数字广告、线下广告、在线聊天、社交媒体、赞助
419 0
|
12月前
|
存储 搜索推荐 数据挖掘
LinkFlow CDP科普篇05:客户数据中台,当代数字化营销的顶梁柱
客户数据中台(CDP)的出现,打破了现有的SaaS营销栈格局
142 0