实战案例|金融行业客户流失预警模型~

简介: 大家好,我是志斌~今天跟大家分享一下逻辑回归模型在商业实战中的应用。

00原理


逻辑回归模型的主要用途是判断某物品属于A类、B类、C类...的概率,概率的取值范围是(0,1),因为线性回归方程的取值是(-∞,+∞),我们无法直接使用线性回归方程,所以我们需要利用Sigmoid函数进行转换,将(-∞,+∞)转化为(0,1)。Sigmoid函数图像,如下图所示。


61.png


Sigmoid函数图像绘制代码为:


import matplotlib.pyplot as plt
import numpy as np
x = np.linspace(-10,10)
y = 1.0 / (1.0+np.exp(-x))
ax = plt.gca() 
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['bottom'].set_position(('data', 0))  
ax.spines['left'].set_position(('data', 0))
plt.plot(x,y)
plt.show()


有了概率,就可以开始预测分类了,根据概率的大小,来判定物品属于哪个分类。下面用一个实际案例来跟大家演示一下。


01概述


大家知道,股民在股市中的每一笔交易,都需要给其账户所在的证券公司支付一笔手续费,这笔费用对于证券公司来说,是一笔非常可观的收入。


如果一个股民不在该证券公司进行交易,那么这个股民就流失了,证券公司也就失去了一个收入来源。因此,证券公司为了预防股民流失会搭建一套客户流失预警模型,来对股民流失概率进行预测,对流失概率大的客户采取相应的挽回措施。


本文以客户流失预警模型为例来跟大家分享逻辑回归模性在商业实战中的应用。


02数据预处理


我们先读取数据,并对其进行预处理。

01

读取数据


import pandas as pd
df = pd.read_excel('股票客户流失.xlsx')
df.head(10)


66.png


划分数据集


逻辑回归模型在搭建和使用前,需要将数据集分为训练集和测试集。前者用于对模型的搭建,后者是为了检验模型。

from sklearn.model_selection import train_test_split
X = df.drop(columns='是否流失')
Y = df['是否流失']
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size=0.2)  # test_size可以调节测试集大小


03模型搭建和使用


上面我们已经将数据集划分好,接下来我们可以开始对模型进行搭建和使用了。


01 模型搭建


Python的Sklearn库已经将模型给集成了,我们只需要调用使用即可。

from sklearn.linear_model import LogisticRegression  # 引入回归模型
model = LogisticRegression()
model.fit(X_train,Y_train)                # 进行训练


02

模型使用


逻辑回归模型是用来预测结果的方式为:


Y_predict = model.predict(X_test)   # 预测结果


对前10个预测结果观察发现,预测准确度为90%。


67.png


查看模型的预测准确度可以使用score函数,代码如下:


model.score(X_test,Y_test)    # 查看模型预测准确度


得到结果为:78.7%,看来该模型搭建的不错。


04小结


  1. 本文简单介绍了逻辑回归模型原理,并搭建客户流失预警模型来进行实战操作,有兴趣的读者可以自己复现一下。
  2. 模型搭建好后,还需要进行评估,下一篇文章教大家怎么用ROC曲线和KS曲线对模型进行评估。
  3. 本文仅供参考学习,不做它用。
  4. 有需要本文数据集和代码的,联系志斌获取~


相关文章
|
4月前
|
人工智能 数据挖掘 数据库
客户在哪儿AI——做真正管用的大客户获客方案
我们的目标是打造高效的ToB大客户获客方案。客户在哪儿AI生成企业全历史行为数据并提供数据分析服务,帮助企业从上帝视角洞察营销。通过真实案例展示,AI能显著提升活动营销效果,例如仅通过10场活动即可触及贡献44.9%营收的客户,30场则可达73.3%,极大提高效率。此外,在决策层和销售工作中,AI发现了某一关键客户与其69.3%营收来源有深层联系,证实了聚焦此客户的战略价值。我们虽不能公开全部细节,但愿与有兴趣者分享真实分析流程。由于服务刚启动,目前尚未有足够反馈,未来将及时分享成果。
|
12月前
|
机器学习/深度学习 人工智能 监控
如何利用AI实现银行存量客户的营销?
金融行业是当今大数据、人工智能应用最广、最深的领域之一。随着数据仓库和数据科学的发展,以银行为代表的金融行业企业拥有了海量数据,应运而生了金融领域的大数据分析、智能营销等大数据和人工智能的应用。其中针对存量客户的智能营销成为银行业的一项重要策略。
|
6月前
|
监控 搜索推荐 数据挖掘
如何利用客户管理软件实现精准获客?精准获客营销工具大揭秘!
本文探讨了如何使用CRM软件进行精准获客,强调了客户数据集成分析、精准定位与个性化营销及跟踪优化的重要性。CRM系统帮助构建全面客户数据库,挖掘深层洞察,制定精准策略;定位目标群体,设计个性化营销活动,利用自动化工具提升效率;同时,实时跟踪营销效果,深入分析ROI并持续优化策略。Zoho CRM作为工具,助力企业提高获客效率和营销ROI。
110 1
|
自然语言处理 供应链 搜索推荐
基于评论的跨境电商产品满意度分析_kaic
随着互联网与移动网络的迅速普及和应用,电子商务平台迅速崛起,人们的消费购物习惯发生了巨大变革[1]。在消费升级的背景下,消费者越来越看重商品的品质,对于消费的需求不再局限于国内提供的商品,国外高档品牌受到国内消费者们的青睐,经济全球化的趋势开始在城镇居民社会生活的方方面面体现的越来越明显。相比于线下商场要承担的高昂代理费、店铺租金等费用,跨境电子商务平台利用互联网信息传输速度快、范围广、虚拟性等特点[2],打破了传统商务活动的时间和地域限制[3],以 B2B2C 的形式搭建起海外品牌与消费者之间的桥梁,降低营销运营成本的同时,还减少了交易环节[4]。根据艾媒咨询(iiMedia Researc
|
BI 开发者
《中国开发者画像洞察报告2022》——04 基于开发者人群的趋势预测(上)
《中国开发者画像洞察报告2022》——04 基于开发者人群的趋势预测(上)
164 0
|
存储 Kubernetes 架构师
《中国开发者画像洞察报告2022》——04 基于开发者人群的趋势预测(下)
《中国开发者画像洞察报告2022》——04 基于开发者人群的趋势预测(下)
163 0
|
开发者
《中国开发者画像洞察报告2022》——03 开发者人群特征洞察——3.2 创新担当
《中国开发者画像洞察报告2022》——03 开发者人群特征洞察——3.2 创新担当
102 0
|
开发者
《中国开发者画像洞察报告2022》——02 开发者面临的挑战——2.1 新⾏业
《中国开发者画像洞察报告2022》——02 开发者面临的挑战——2.1 新⾏业
|
SQL 存储 JSON
日处理消息2亿,通过核对体系做资损防控的技术挑战
日处理消息2亿,通过核对体系做资损防控的技术挑战
440 0
|
机器学习/深度学习 数据采集 算法
大数据分析案例-对电信客户流失分析预警预测
大数据分析案例-对电信客户流失分析预警预测
1520 0
大数据分析案例-对电信客户流失分析预警预测