4、利用python工具包输出
(1)、分位图查找异常点
(2)、输出头数据和尾数据
(3)、输出统计信息
5、对整个数据集各个特征(属性)PCP(平行坐标图)可视化分析
6、属性之间关系的关系SP可视化
7、特殊属性和标签的关系SP可视化
8、利用皮尔逊相关系数计算任意两个特征(属性)之间相关程度
(1)、如图分别计算的是2&3、2&21两个相关度数值
分别计算第2&3、2&21个属性参数相关度,发现2&3之间相关度比2&21高!
9、Heat Map热图:利用皮尔森相关系数矩阵,且使用HM可视化变量之间的相关性
三、测试该数据集上度量分类器性能
T1、OLS构建分类器
1、输出结果
2、ROC、AUC可视化分析
T2、RiR构建分类器+AUC度量分离器性能










