实战案例|金融行业客户流失预警模型~

简介: 大家好,我是志斌~今天跟大家分享一下逻辑回归模型在商业实战中的应用。

00原理


逻辑回归模型的主要用途是判断某物品属于A类、B类、C类...的概率,概率的取值范围是(0,1),因为线性回归方程的取值是(-∞,+∞),我们无法直接使用线性回归方程,所以我们需要利用Sigmoid函数进行转换,将(-∞,+∞)转化为(0,1)。Sigmoid函数图像,如下图所示。


61.png


Sigmoid函数图像绘制代码为:


import matplotlib.pyplot as plt
import numpy as np
x = np.linspace(-10,10)
y = 1.0 / (1.0+np.exp(-x))
ax = plt.gca() 
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['bottom'].set_position(('data', 0))  
ax.spines['left'].set_position(('data', 0))
plt.plot(x,y)
plt.show()


有了概率,就可以开始预测分类了,根据概率的大小,来判定物品属于哪个分类。下面用一个实际案例来跟大家演示一下。


01概述


大家知道,股民在股市中的每一笔交易,都需要给其账户所在的证券公司支付一笔手续费,这笔费用对于证券公司来说,是一笔非常可观的收入。


如果一个股民不在该证券公司进行交易,那么这个股民就流失了,证券公司也就失去了一个收入来源。因此,证券公司为了预防股民流失会搭建一套客户流失预警模型,来对股民流失概率进行预测,对流失概率大的客户采取相应的挽回措施。


本文以客户流失预警模型为例来跟大家分享逻辑回归模性在商业实战中的应用。


02数据预处理


我们先读取数据,并对其进行预处理。

01

读取数据


import pandas as pd
df = pd.read_excel('股票客户流失.xlsx')
df.head(10)


66.png


划分数据集


逻辑回归模型在搭建和使用前,需要将数据集分为训练集和测试集。前者用于对模型的搭建,后者是为了检验模型。

from sklearn.model_selection import train_test_split
X = df.drop(columns='是否流失')
Y = df['是否流失']
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size=0.2)  # test_size可以调节测试集大小


03模型搭建和使用


上面我们已经将数据集划分好,接下来我们可以开始对模型进行搭建和使用了。


01 模型搭建


Python的Sklearn库已经将模型给集成了,我们只需要调用使用即可。

from sklearn.linear_model import LogisticRegression  # 引入回归模型
model = LogisticRegression()
model.fit(X_train,Y_train)                # 进行训练


02

模型使用


逻辑回归模型是用来预测结果的方式为:


Y_predict = model.predict(X_test)   # 预测结果


对前10个预测结果观察发现,预测准确度为90%。


67.png


查看模型的预测准确度可以使用score函数,代码如下:


model.score(X_test,Y_test)    # 查看模型预测准确度


得到结果为:78.7%,看来该模型搭建的不错。


04小结


  1. 本文简单介绍了逻辑回归模型原理,并搭建客户流失预警模型来进行实战操作,有兴趣的读者可以自己复现一下。
  2. 模型搭建好后,还需要进行评估,下一篇文章教大家怎么用ROC曲线和KS曲线对模型进行评估。
  3. 本文仅供参考学习,不做它用。
  4. 有需要本文数据集和代码的,联系志斌获取~


相关文章
|
10月前
|
机器学习/深度学习 算法 数据挖掘
如何利用 BI 工具分析客户流失原因?
如何利用 BI 工具分析客户流失原因?
288 10
|
7月前
|
弹性计算 开发者
【上云基础系列-01】如何把控公网带宽费,实现低成本用云(基于单体架构)
本文主要面向开发者,介绍在单体架构下如何巧妙选择服务器和公网产品方案,实现低门槛用云。针对个人开发者和企业不同需求,推荐使用阿里云的ECS、EIP和CDT组合方案,特别是CDT提供的200GB/月免费公网流量,帮助用户显著降低网络成本。该方案不仅适合个人开发者的低成本需求,也满足初创企业和大型电商平台的扩展要求。通过灵活配置服务,用户可以在保障性能的同时实现成本节约。
|
安全 Unix Linux
Windows如何远程连接服务器?服务器远程连接图文教程
服务器操作系统可以实现对计算机硬件与软件的直接控制和管理协调,任何计算机的运行离不开操作系统,服务器也一样,服务器操作系统主要分为四大流派:Windows Server、Netware、Unix和Linux。今天驰网飞飞将和你分享Windows server远程连接图文教程,希望可以帮助到你
4907 4
Windows如何远程连接服务器?服务器远程连接图文教程
|
9月前
|
SQL 存储 分布式计算
MaxCompute近实时数仓能力升级
本文介绍了阿里云自研的离线实时一体化数仓,重点涵盖MaxCompute和Hologres两大产品。首先阐述了两者在ETL处理、AP分析及Serverless场景中的核心定位与互补关系。接着详细描述了MaxCompute在近实时能力上的升级,包括Delta Table形态、增量计算与查询支持、MCQ 2.0的优化等关键技术,并展示了其性能提升的效果。最后展望了未来在秒级数据导入、多引擎融合及更高效资源利用方面的改进方向。
|
Apache 图形学
WebGL☀️Unity WebGL适配到各平台的教程
WebGL☀️Unity WebGL适配到各平台的教程
|
存储 JavaScript 开发者
【Docker】什么是Docker镜像?
【4月更文挑战第20天】【Docker】什么是Docker镜像?
|
Dart 前端开发 JavaScript
移动应用开发中的跨平台解决方案
【7月更文挑战第10天】 在移动应用开发的广阔天地中,跨平台解决方案如同一把瑞士军刀,为开发者提供了多面手的便利。本文将深入探讨跨平台技术的核心优势与挑战,并通过实例分析,揭示这些解决方案如何影响移动应用的构建和生态系统。我们将一同见证跨平台技术如何在不断变化的移动市场中,为开发者和企业带来创新的机遇。
|
机器学习/深度学习 人工智能 自然语言处理
揭秘未来:量子计算与人工智能的融合之路
本文旨在探讨量子计算和人工智能(AI)的结合前景及其对科技领域的潜在影响。通过分析当前技术发展态势,揭示两者融合所带来的创新机遇与挑战,并预测其对未来社会变革的可能贡献。文章将深入剖析量子计算在解决复杂问题方面的优势,以及AI在模式识别和数据分析方面的专长,进而展望两者结合在未来技术革新中的关键作用。
|
消息中间件 Kafka Docker
docker部署kafka
docker部署kafka
358 1
|
机器学习/深度学习 数据采集 人工智能