PCA 人脸识别
结果可视化
结果图
控制台结果图
朴素贝叶斯分类
使用鸢尾花数据集,由于数据集是连续型数据,因此,假设各个属性是成正态分布的,采用密度函数进行概率计算。
代码写的不怎么简洁,但是把过程思路基本写出来了。
结果图
DecisionTree
决策树分类
实验环境:
- 系统:Windows 10
- 语言:Python3.6
- IDE:Sublime Text3.
- 数据集:数据集是自己创建的,详情见代码或者是图片“数据集.png”。
实验目的:
了解三种不同决策树的工作原理,使用自己创建的数据集,对数据进行分类,完成决策树的绘制。
实验过程:
学习三种决策树的工作原理,了解到三种决策树的区别如下:
ID3 算法以信息增益为准则来进行选择划分属性,选择信息增益最大的进行划分;
算法先从候选划分属性中找出信息增益高于平均水平的属性,再从中选择增益率最高的;
CART 算法使用“基尼指数”来选择划分属性,选择基尼值最小的属性作为划分属性。
实验数据集:
编写代码,此次实验编程语言使用的是 python。详细算法步骤见文件 decision_tree.py 和 treePlot.py 中的注释。decision_tree.py 是用来实现属性划分的,treePlot.py 是用来实现最终决策树绘制的。
实验结果
实验结果如下:
ID3 决策树:
决策树:
CART 决策树:
实验结论:
由以上实验结果我们可以看到,ID3 和 C4.5 决策树的最优索引相同,所绘制出来的决策树是也是相同的,而 CART 绘制出来的决策树与前 2 种不同。
完整代码:https://download.csdn.net/download/qq_38735017/87415806