python 机器学习 sklearn——手把手教你预测心脏病

简介: python 机器学习 sklearn——手把手教你预测心脏病

流程

1.数据导入,清洗拆分

2.通过sklearn得到数据模型

3.开始预测(这里我们将用回归和决策树来进行预测)

前期准备

数据

心脏病数据下载

导包

```
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier

这里我们主要是sklearn的包,以及numpy,方便对于数据进行操作

数据操作

准备 样本数据 结果数据

最后一列是我们的结果,我们需要把我们的结果和各项身体数据进行分离

#删除最后一列  样本数据
features=heart_df.drop(columns=["target"])
#保存标签 结果数据
target=heart_df["target"]

切分训练集

我们的训练集合的比列以3:1最为合适,即学习数据75%,预测数据25%,在sklearn里面也会有专门的函数来采集样本

#切分训练集
X_train,X_test,Y_train,Y_test=train_test_split(features,target,test_size=0.25)

训练数据

逻辑回归

def test_logistic(*data):
    X_train, X_test, Y_train, Y_test=data
    clf=LogisticRegression()#逻辑回归
    clf.fit(X_test,Y_test)#梯度下降,递归
    print("学习模型预测成绩:{:.4f}".format(clf.score(X_train,Y_train)))
    print("实际模型预测成绩:{:.4f}".format(clf.score(X_test, Y_test)))

决策树

def test_decision_tree(*data):
    X_train, X_test, Y_train, Y_test = data
    clf=DecisionTreeClassifier(max_depth=3,criterion="entropy")
    clf.fit(X_train,Y_train)
    print("学习模型决策树预测成绩:{:.4f}".format(clf.score(X_train, Y_train)))
    print("实际模型决策树预测成绩:{:.4f}".format(clf.score(X_test, Y_test)))
    # decision_tree_pre=clf.predict(X_test)
    # print("decision_tree:",decision_tree_pre)
    # print("true lbel:",Y_test)
    return clf

结果

这样我们的预测就完成了,我们一起来看看结果吧

决策树的结果可以输出喔

总结

经过这一顿操作下来,我们一起再好好的总结一下,起始就是将我们的数据的取值情况和它的特征先分开,然后我们利用train_test_split去获得取值,然后直接使用clf函数来进行学习,再去对我们的结果获取成绩

相关文章
|
10天前
|
机器学习/深度学习 数据可视化 搜索推荐
Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。
【7月更文挑战第5天】Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。流程包括数据获取、预处理、探索、模型选择、评估与优化,以及结果可视化。示例展示了用户行为、话题趋势和用户画像分析。Python的丰富生态使得社交媒体洞察变得高效。通过学习和实践,可以提升社交媒体分析能力。
25 1
|
6天前
|
机器学习/深度学习 监控 算法
Python数据分析与机器学习在金融风控中的应用
Python数据分析与机器学习在金融风控中的应用
31 12
|
7天前
|
机器学习/深度学习 数据采集 搜索推荐
Python数据分析与机器学习在电子商务推荐系统中的应用
Python数据分析与机器学习在电子商务推荐系统中的应用
24 5
|
7天前
|
机器学习/深度学习 算法 Python
【Python】已完美解决:机器学习填补数值型缺失值时报错)TypeError: init() got an unexpected keyword argument ‘axis’,
【Python】已完美解决:机器学习填补数值型缺失值时报错)TypeError: init() got an unexpected keyword argument ‘axis’,
12 1
|
10天前
|
机器学习/深度学习 算法 文件存储
使用Python实现深度学习模型:神经架构搜索与自动机器学习
【7月更文挑战第5天】 使用Python实现深度学习模型:神经架构搜索与自动机器学习
25 2
|
6天前
|
机器学习/深度学习 算法 Python
【Python】已解决:ModuleNotFoundError: No module named ‘sklearn‘
【Python】已解决:ModuleNotFoundError: No module named ‘sklearn‘
13 0
|
机器学习/深度学习 Python
Python之sklearn2pmml:sklearn2pmml库函数的简介、安装、使用方法之详细攻略daiding
Python之sklearn2pmml:sklearn2pmml库函数的简介、安装、使用方法之详细攻略daiding
Python之sklearn2pmml:sklearn2pmml库函数的简介、安装、使用方法之详细攻略daiding
|
机器学习/深度学习 Python
Python之sklearn2pmml:sklearn2pmml库函数的简介、安装、使用方法之详细攻略
Python之sklearn2pmml:sklearn2pmml库函数的简介、安装、使用方法之详细攻略
Python之sklearn2pmml:sklearn2pmml库函数的简介、安装、使用方法之详细攻略
|
6天前
|
安全 Python
告别低效编程!Python线程与进程并发技术详解,让你的代码飞起来!
【7月更文挑战第9天】Python并发编程提升效率:**理解并发与并行,线程借助`threading`模块处理IO密集型任务,受限于GIL;进程用`multiprocessing`实现并行,绕过GIL限制。示例展示线程和进程创建及同步。选择合适模型,注意线程安全,利用多核,优化性能,实现高效并发编程。
20 3
|
8天前
|
开发者 Python
Python元类实战:打造你的专属编程魔法,让代码随心所欲变化
【7月更文挑战第7天】Python的元类是编程的变形师,用于创建类的“类”,赋予代码在构建时的变形能力。
30 1