数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化(下)

简介: 数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化

数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化(上):https://developer.aliyun.com/article/1489839

# 查看cigsPerDay
cigs\_sub <- comled\_dta
# 查看totChol,删除异常点
# 查看sysBP, 删除异常点
# 查看BMI

totChol: 总胆固醇水平大于240mg/dl已属于非常高,故删去水平值为600mg/dl的记录。sysBP: 去掉收缩压为295mg/dl的记录

# 删除各变量离群点
competedata
# 分类型变量列联分析
ggplot+geom_boxplot

ggplot+geom_boxplot(aes,totChol,fill=TenYerCHD))

cometddata %>% fitr %>%

ggplot

由图像知,glucose和hearRate变量有不显着的风险

table1=table

chisq.test

table1

table2=table

chisq.test

table3=table

chisq.test

chisq.test

ggpairs

diaBP和sysBP有多重共线性的问题。

currentSmoker变量可能不显着,下面进入模型部分。


模型


# 划分数据集
split = sample.split
train = subset

逻辑回归


# 逻辑回归模型 - 使用所有变量
fultaog = glm
summary(fulog)

fldaog = glm

summary(fuatLg)

prdts = predict

glm_le <- table

ACCU

随机森林


rfoel <- randomForest

# 获得重要性

imprace

相关视频:Boosting原理与R语言提升回归树BRT预测短鳍鳗分布


# 选择重要的因素

rfmdel <- randomForest

# 误差

plot

# 获取重要性

ggplot +

  geom_bar

  geom_text

这里有患病风险的误差不降反升,需要探究其中原因

# 绘制分类图像
pred<-predict
pdou_1<-predict  #输出概率
table <- table
sum(diag/sum #预测准确率

plot(margin

SVM支持向量机


# 先进行模型调优

tud <- tune.svm

summary(tud )

# 使用turning函数得到最佳参数设置支持向量机

mel.nd <- svm

cost=tuned$

summary(modted)

# 调用predict函数基于刚配置好的SVM模型进行类标号的预测:

sm.ne.ed <- predict

sv.tuedtble <- table

sm.ue.tbe

acy.s.vm <- sum(diag)/sum

模型诊断


根据上面三个模型的结果,可以看出预测结果的类别数量分布非常不均衡

sum

sum(TeYaHD == 0)

针对这一现象,需要采取方法平衡数据集。

相关文章
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|数据分享-1
逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|数据分享
|
机器学习/深度学习 数据采集 算法
机器学习-模型拟合:如何使用逻辑回归精准预测临床诊断结果?
本文旨在介绍逻辑回归模型在临床诊断结果预测中的应用,并探讨相关需求和挑战。首先,将详细介绍逻辑回归模型的原理和特点,以及其在机器学习中的地位和应用范围。接着,将阐述临床诊断结果预测的重要性和现实需求,以及逻辑回归模型如何满足这些需求。
492 0
|
7月前
|
机器学习/深度学习 数据可视化
逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|数据分享-2
逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|数据分享
|
7月前
|
机器学习/深度学习 数据可视化
逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|数据分享-3
逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|数据分享
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化(上)
数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化
|
7月前
|
机器学习/深度学习 算法 数据库
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
|
7月前
|
机器学习/深度学习 算法
【视频】R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险|数据分享
【视频】R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险|数据分享
|
7月前
|
机器学习/深度学习 算法 搜索推荐
【视频】决策树模型原理和R语言预测心脏病实例|数据分享(上)
【视频】决策树模型原理和R语言预测心脏病实例|数据分享
|
7月前
|
数据可视化
R语言GAMLSS模型对艾滋病病例、降雪量数据拟合、预测、置信区间实例可视化
R语言GAMLSS模型对艾滋病病例、降雪量数据拟合、预测、置信区间实例可视化
|
7月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化(下)
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化