本节书摘来自华章计算机《R语言数据挖掘:实用项目解析》一书中的第2章,第2.9节,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),译 黄芸,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.9 无参数方法
当一个训练数据集不满足任何假定的某种概率分布时,唯一的选择就是通过无参数方法分析数据集。无参数方法不服从概率分布假设。使用无参数方法,我们可以不基于概率分布的前提假设来实施推断和假设检验。现在我们来看当一个数据集不满足任何概率分布前提假设时,可使用的一系列无参数检验。
2.9.1 Wilcoxon符号秩检验
如果正态性假设不成立,就需要利用无参数方法来回答这个问题——自动挡和手动挡汽车的市内平均行车里程数是否有差别?
若两个样本恰好成对而又不满足正态性假设,则可使用参数paired:
2.9.2 Mann-Whitney-Wilcoxon检验
若两个样本不匹配、独立且不服从正态分布,则需要使用Mann-Whitney-Wilcoxon检验来判断两个样本的平均差有显著差异的假设。
2.9.3 Kruskal-Wallis检验
要比较两组以上数据的平均值,也即无参方法的方差分析,可以使用Kruskal-Wallis检验。这也被称作无分布的统计检验: