本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.9节无参数方法,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看
2.9 无参数方法
当一个训练数据集不满足任何假定的某种概率分布时,唯一的选择就是通过无参数方法分析数据集。无参数方法不服从概率分布假设。使用无参数方法,我们可以不基于概率分布的前提假设来实施推断和假设检验。现在我们来看当一个数据集不满足任何概率分布前提假设时,可使用的一系列无参数检验。
2.9.1 Wilcoxon符号秩检验
如果正态性假设不成立,就需要利用无参数方法来回答这个问题——自动挡和手动挡汽车的市内平均行车里程数是否有差别?
![21d112a1f1ce99e249e431fabfe60f0484d97f5e](https://yqfile.alicdn.com/21d112a1f1ce99e249e431fabfe60f0484d97f5e.png?x-oss-process=image/resize,w_1400/format,webp)
若两个样本恰好成对而又不满足正态性假设,则可使用参数paired:
![de8c62bc5d0fb8d1037504b94f48cb6a55be691f](https://yqfile.alicdn.com/de8c62bc5d0fb8d1037504b94f48cb6a55be691f.png?x-oss-process=image/resize,w_1400/format,webp)
2.9.2 Mann-Whitney-Wilcoxon检验
若两个样本不匹配、独立且不服从正态分布,则需要使用Mann-Whitney-Wilcoxon检验来判断两个样本的平均差有显著差异的假设。
![f8edac0c6bbb884b1a4ff0d15d700d6f721a208e](https://yqfile.alicdn.com/f8edac0c6bbb884b1a4ff0d15d700d6f721a208e.png?x-oss-process=image/resize,w_1400/format,webp)
2.9.3 Kruskal-Wallis检验
要比较两组以上数据的平均值,也即无参方法的方差分析,可以使用Kruskal-Wallis检验。这也被称作无分布的统计检验:
![bfbfccfaccaf203476690ce8936e50a9f7236fd6](https://yqfile.alicdn.com/bfbfccfaccaf203476690ce8936e50a9f7236fd6.png?x-oss-process=image/resize,w_1400/format,webp)