python逻辑回归预测之信用卡逾期实战(附源码)

简介: python逻辑回归预测之信用卡逾期实战(附源码)

不同于线性回归是预测出来具体的值,逻辑回归本质上是分类问题,逻辑回归将值映射到(0,1)集合。


逻辑回归是根据现有数据对分类边界线建立回归公式,以此进行分类。逻辑回归在线性回归的基础上,通过引入sigmoid函数,将线性回归的输出值映射到(0,1)上,接下来使用阈值将结果转换成0或1就能够完成两类问题的预测。


问题描述:某银行搜集乐园用户贷款,收入和信用卡是否逾期的信息,使用这些数据建立一个能预测信用卡逾期情况的逻辑回归模型,使用梯度下降法确定模型参数,并绘图显示损失函数的变化过程。


数据部分示意图如下

1666430781625.jpg

初始数据可视化如下

1666430794987.jpg

经过逻辑回归后分界线可视化如下

1666430822632.jpg

损失函数可视化如下 可以看到随着迭代次数的增加损失函数一直在减小 直到收敛

1666430835652.jpg

源代码如下

import numpy as np
import pandas as pd
import matplotlib; matplotlib.use('TkAgg')
df=pd.read_csv(r"credit-overdue.csv")
print(df.head())
from matplotlib import  pyplot as plt
matplotlib.rcParams['font.family'] = 'SimHei'
matplotlib.rcParams['font.size'] = 10
matplotlib.rcParams['axes.unicode_minus']=False
plt.figure(figsize=(10,6))
map_size={0:20,1:100}
size=list(map(lambda x:map_size[x],df['overdue']))
plt.scatter(df['debt'],df['income'],s=size,c=df['overdue'],marker='v')
plt.show()
#step 3
def sigmoid(z):#逻辑函数 把值放缩到0 1之间
    sigmoid=1/(1+np.exp(-z))
    return  sigmoid
def loss(h,y):#损失函数
    loss=(-y*np.log(h)-(1-y)*np.log(1-h)).mean()
    return  loss
def gradient(X,h,y):#梯度下降
    gradient=np.dot(X.T,(h-y)/y.shape[0])
    return  gradient
#逻辑回归函数
def Logistic_Regression(x,y,lr,num_iter):
    intercept=np.ones((x.shape[0],1))
    x=np.concatenate((intercept,x),axis=1)
    w=np.zeros(x.shape[1])
    l_list=[]
    for i in range(num_iter):#梯度迭代下降
        z=np.dot(x,w)#线性函数
        h=sigmoid(z)
        g=gradient(x,h,y)
        w-=lr*g
        z=np.dot(x,w)
        h=sigmoid(z)
        l=loss(h,y)
        l_list.append(l)
    return l,w
x=df[['debt','income']].values
y=df['overdue'].values
lr=0.01
num_iter=30000
l_y=Logistic_Regression(x,y,lr,num_iter)
L=Logistic_Regression(x,y,lr,num_iter)
print("第一个为损失函数值 第二个为梯度下降")
print(l_y)
plt.figure(figsize=(10,6))
map_size={0:20,1:100}
size=list(map(lambda x:map_size[x],df['overdue']))
plt.scatter(df['debt'],df['income'],s=size,c=df['overdue'],marker='v')
x1_min,x1_max=df['debt'].min(),df['debt'].max()
x2_min,x2_max=df['income'].min(),df['income'].max()
xx1,xx2=np.meshgrid(np.linspace(x1_min,x1_max),np.linspace(x2_min,x2_max))
grid=np.c_[xx1.ravel(),xx2.ravel()]
probs=(np.dot(grid,np.array([L[1][1:3]]).T)+L[1][0]).reshape(xx1.shape)
plt.contour(xx1,xx2,probs,levels=[0],linewidths=1,colors='red')
plt.show()
'''
plt.plot([i for i in range(len(l_y))],l_y)
plt.xlabel("迭代次数")
plt.ylabel("损失函数")
plt.show()
'''
相关文章
|
2月前
|
人工智能 JavaScript API
零基础构建MCP服务器:TypeScript/Python双语言实战指南
作为一名深耕技术领域多年的博主摘星,我深刻感受到了MCP(Model Context Protocol)协议在AI生态系统中的革命性意义。MCP作为Anthropic推出的开放标准,正在重新定义AI应用与外部系统的交互方式,它不仅解决了传统API集成的复杂性问题,更为开发者提供了一个统一、安全、高效的连接框架。在过去几个月的实践中,我发现许多开发者对MCP的概念理解透彻,但在实际动手构建MCP服务器时却遇到了各种技术壁垒。从环境配置的细节问题到SDK API的深度理解,从第一个Hello World程序的调试到生产环境的部署优化,每一个环节都可能成为初学者的绊脚石。因此,我决定撰写这篇全面的实
392 67
零基础构建MCP服务器:TypeScript/Python双语言实战指南
|
2月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
254 0
|
1月前
|
数据采集 存储 Web App开发
Python爬虫库性能与选型实战指南:从需求到落地的全链路解析
本文深入解析Python爬虫库的性能与选型策略,涵盖需求分析、技术评估与实战案例,助你构建高效稳定的数据采集系统。
170 0
|
2月前
|
API 数据安全/隐私保护 开发者
企业微信自动加好友软件,导入手机号批量添加微信好友,python版本源码分享
代码展示了企业微信官方API的合规使用方式,包括获取access_token、查询部门列表和创建用户等功能
|
2月前
|
缓存 监控 API
1688平台开放接口实战:如何通过API获取店铺所有商品数据(Python示列)
本文介绍如何通过1688开放平台API接口获取店铺所有商品,涵盖准备工作、接口调用及Python代码实现,适用于商品同步与数据监控场景。
|
2月前
|
存储 数据安全/隐私保护 开发者
Python深浅拷贝全解析:从原理到实战的避坑指南
在Python开发中,深浅拷贝是处理对象复制的关键概念。直接赋值仅复制引用,修改副本会影响原始数据。浅拷贝(如切片、copy方法)创建新容器但共享嵌套对象,适用于单层结构或需共享子对象的场景;而深拷贝(copy.deepcopy)递归复制所有层级,确保完全独立,适合嵌套结构或多线程环境。本文详解二者原理、实现方式及性能考量,帮助开发者根据实际需求选择合适的拷贝策略,避免数据污染与性能浪费。
150 1
|
2月前
|
存储 监控 安全
Python剪贴板监控实战:clipboard-monitor库的深度解析与扩展应用
本文介绍如何利用Python的clipboard-monitor库实现剪贴板监控系统,涵盖文本与图片的实时监听、防重复存储、GUI界面开发及数据加密等核心技术,适用于安全审计与自动化办公场景。
67 0
|
2月前
|
数据采集 存储 监控
Python爬虫实战:批量下载亚马逊商品图片
Python爬虫实战:批量下载亚马逊商品图片
|
2月前
|
机器人 API 数据安全/隐私保护
QQ机器人插件源码,自动回复聊天机器人,python源码分享
消息接收处理:通过Flask搭建HTTP服务接收go-cqhttp推送的QQ消息47 智能回复逻辑
|
2月前
|
数据采集 机器学习/深度学习 边缘计算
Python爬虫动态IP代理报错全解析:从问题定位到实战优化
本文详解爬虫代理设置常见报错场景及解决方案,涵盖IP失效、403封禁、性能瓶颈等问题,提供动态IP代理的12种核心处理方案及完整代码实现,助力提升爬虫系统稳定性。
112 0

热门文章

最新文章

推荐镜像

更多