ML之二分类预测:以岩石水雷数据集(RockMine)为例从0到1深入理解科学预测之分类问题的思路框架(特征工程详细步骤(特征分析与特征处理)+分类模型设计)

简介: ML之二分类预测:以岩石水雷数据集(RockMine)为例从0到1深入理解科学预测之分类问题的思路框架(特征工程详细步骤(特征分析与特征处理)+分类模型设计)

4、利用python工具包输出


(1)、分位图查找异常点


image.png


(2)、输出头数据和尾数据


image.png


(3)、输出统计信息


image.png


5、对整个数据集各个特征(属性)PCP(平行坐标图)可视化分析


image.png


6、属性之间关系的关系SP可视化

image.png



7、特殊属性和标签的关系SP可视化


image.png


8、利用皮尔逊相关系数计算任意两个特征(属性)之间相关程度


(1)、如图分别计算的是2&3、2&21两个相关度数值


分别计算第2&3、2&21个属性参数相关度,发现2&3之间相关度比2&21高!



9、Heat Map热图:利用皮尔森相关系数矩阵,且使用HM可视化变量之间的相关性


image.png


三、测试该数据集上度量分类器性能


T1、OLS构建分类器


1、输出结果

image.png



2、ROC、AUC可视化分析

image.png




T2、RiR构建分类器+AUC度量分离器性能


image.png



image.png


相关文章
|
2月前
|
机器学习/深度学习 自然语言处理 算法
如何利用机器学习算法提高分类准确率
【2月更文挑战第7天】机器学习在现代科技中扮演着重要的角色。分类是其中一种基本的机器学习任务,而分类准确率是衡量分类模型好坏的重要指标。本文将介绍如何利用机器学习算法来提高分类准确率。
21 0
|
8月前
|
机器学习/深度学习 算法 数据可视化
机器学习-特征选择:如何使用相关性分析精确选择最佳特征?
本文致力于利用相关性分析来辅助特征选择过程。相关性分析作为一种用于量化特征之间关系的方法,可以帮助我们理解数据中的潜在模式和相互作用。通过分析特征之间的相关性,我们可以更加准确地选择具有高预测能力和独立性的特征,从而提高特征选择的效果和结果。
796 0
|
机器学习/深度学习 人工智能 算法
目标检测模型设计准则 | YOLOv7参考的ELAN模型解读,YOLO系列模型思想的设计源头
目标检测模型设计准则 | YOLOv7参考的ELAN模型解读,YOLO系列模型思想的设计源头
702 0
目标检测模型设计准则 | YOLOv7参考的ELAN模型解读,YOLO系列模型思想的设计源头
|
8月前
|
机器学习/深度学习 数据采集 算法
机器学习-特征选择:如何使用Lassco回归精确选择最佳特征?
本文旨在介绍Lasso回归在精确特征选择中的应用。首先,我们将探讨特征选择的重要性,包括如何提高模型性能和降低计算成本。接着,我们将深入解析Lasso回归的原理和算法,并说明其在特征选择中的优势。为了支撑我们的观点,我们将引用相关文献提供的实证结果和案例分析。
1302 1
|
11月前
|
机器学习/深度学习 人工智能 算法
目标检测模型设计准则 | YOLOv7参考的ELAN模型解读,YOLO系列模型思想的设计源头(一)
目标检测模型设计准则 | YOLOv7参考的ELAN模型解读,YOLO系列模型思想的设计源头(一)
266 0
|
11月前
|
Go 网络架构 计算机视觉
目标检测模型设计准则 | YOLOv7参考的ELAN模型解读,YOLO系列模型思想的设计源头(二)
目标检测模型设计准则 | YOLOv7参考的ELAN模型解读,YOLO系列模型思想的设计源头(二)
666 0
|
11月前
|
机器学习/深度学习 算法
【机器学习】分类模型评价指标(混淆矩阵、ROC)(已修改,放心看)
【机器学习】分类模型评价指标(混淆矩阵、ROC)(已修改,放心看)
145 0
|
机器学习/深度学习
【机器学习】多标签分类的评价指标与代码实现
【机器学习】多标签分类的评价指标与代码实现
402 1
【机器学习】多标签分类的评价指标与代码实现
|
机器学习/深度学习 数据采集 算法
大数据分析案例-基于逻辑回归算法构建垃圾邮件分类器模型
大数据分析案例-基于逻辑回归算法构建垃圾邮件分类器模型
368 0
大数据分析案例-基于逻辑回归算法构建垃圾邮件分类器模型
|
机器学习/深度学习 算法 数据挖掘
使用图进行特征提取:最有用的图特征机器学习模型介绍
使用图进行特征提取:最有用的图特征机器学习模型介绍
339 0
使用图进行特征提取:最有用的图特征机器学习模型介绍