python逻辑回归模型预测癌症

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: python逻辑回归模型预测癌症

数据准备

使用sklearn.datasets导入癌症数据load_breast_cancer

# 获取数据对象

data=load_breast_cancer()

获取目标变量与特征变量

1. # 导入数据
2. from sklearn.datasets import load_breast_cancer
3. # 获取数据对象
4. data=load_breast_cancer()
5. # 获取目标变量 
6. # 获取特征变量
7. x=data.data 
8. y=data.target
9. 
10. print(len(data.data)) 
11. # print(len(data.target))

数据处理

将导入的数据转化为DataFrame格式,便于后期的数据建模

1. import pandas as pd 
2. data_x=pd.DataFrame(x)
3. data_y=pd.DataFrame(y)
4. data_x
5. data_y

 

数据划分

将导入的数据划分为测试集与训练集两部分

并取80%的数据作为训练集,20%作为测试集

1. # 划分数据集
2. from sklearn.model_selection import train_test_split
3. X_train,X_test,y_train,y_test=train_test_split(data_x,data_y,test_size=0.2)
4. X_train

数据建模

接下来选取逻辑回归模型进行数据建模工作

1. # 模型构建
2. from sklearn.linear_model import LogisticRegression
3. model=LogisticRegression()
4. model.fit(X_train,y_train)
5. model

 

模型评估

使用R的平方(可决系数也称决定系数)来评估模型的好坏,可以看到有94%的结果预测成功的,使用该模型最大的好处就是利用决策树二分类的机制,对数据进行有效的分类,提高预测的准确度

1. y_pred=model.predict(X_test)
2. # 预测结果
3. y_pred
1. # 准确率
2. from sklearn.metrics import accuracy_score
3. score=accuracy_score(y_pred,y_test)
4. score

 

结果预测

讲实际值与预测值进行对比可以发现也存在部分数据预测错误的情况,但从数据的整体预测结果来看可以发现模型的评分是达到了94%的准确率。

1. y_te=[]
2. for i in y_test.values:
3.     y_te.append(i[0])
4. # y_te
5. result={
6. "预测值":list(y_pred),
7. "实际值":list(y_te)
8. }
9. 
10. result=pd.DataFrame(result)
11. result

 

通过该模型能够准确的对癌症的结果进行分类,并达到94% 的准确度。


相关文章
|
3天前
|
机器学习/深度学习 数据采集 数据可视化
使用Python实现深度学习模型:智能舆情监测与分析
【8月更文挑战第16天】 使用Python实现深度学习模型:智能舆情监测与分析
15 1
|
5天前
|
机器学习/深度学习 传感器 自动驾驶
使用Python实现深度学习模型:智能车联网与自动驾驶
【8月更文挑战第14天】 使用Python实现深度学习模型:智能车联网与自动驾驶
26 10
|
3天前
|
机器学习/深度学习 JSON API
【Python奇迹】FastAPI框架大显神通:一键部署机器学习模型,让数据预测飞跃至Web舞台,震撼开启智能服务新纪元!
【8月更文挑战第16天】在数据驱动的时代,高效部署机器学习模型至关重要。FastAPI凭借其高性能与灵活性,成为搭建模型API的理想选择。本文详述了从环境准备、模型训练到使用FastAPI部署的全过程。首先,确保安装了Python及相关库(fastapi、uvicorn、scikit-learn)。接着,以线性回归为例,构建了一个预测房价的模型。通过定义FastAPI端点,实现了基于房屋大小预测价格的功能,并介绍了如何运行服务器及测试API。最终,用户可通过HTTP请求获取预测结果,极大地提升了模型的实用性和集成性。
11 1
|
5天前
|
算法 Ubuntu 机器人
DRAKE - 基于模型的机器人设计与验证 由丰田研究所支持的 C++ / Python 工具箱。
DRAKE - 基于模型的机器人设计与验证 由丰田研究所支持的 C++ / Python 工具箱。
14 1
|
6天前
|
机器学习/深度学习 传感器 物联网
使用Python实现深度学习模型:智能物联网与智能家居
【8月更文挑战第13天】 使用Python实现深度学习模型:智能物联网与智能家居
16 2
|
7天前
|
机器学习/深度学习 数据采集 算法框架/工具
使用Python实现深度学习模型:智能人力资源管理与招聘
【8月更文挑战第12天】 使用Python实现深度学习模型:智能人力资源管理与招聘
18 2
|
1天前
|
机器学习/深度学习 数据采集 数据可视化
使用Python实现深度学习模型:智能娱乐与虚拟现实技术
【8月更文挑战第18天】 使用Python实现深度学习模型:智能娱乐与虚拟现实技术
5 0
|
2天前
|
机器学习/深度学习 数据采集 数据可视化
使用Python实现深度学习模型:智能城市交通管控与优化
【8月更文挑战第17天】 使用Python实现深度学习模型:智能城市交通管控与优化
3 0
|
4天前
|
机器学习/深度学习 传感器 数据采集
使用Python实现深度学习模型:智能工业与工业4.0技术
【8月更文挑战第15天】 使用Python实现深度学习模型:智能工业与工业4.0技术
14 0
|
7天前
|
机器学习/深度学习 数据采集 数据可视化
【python】python心理健康医学数据分析与逻辑回归预测(源码+数据集+论文)【独一无二】
【python】python心理健康医学数据分析与逻辑回归预测(源码+数据集+论文)【独一无二】