《R语言数据挖掘:实用项目解析》——2.9 无参数方法

简介:

本节书摘来自华章计算机《R语言数据挖掘:实用项目解析》一书中的第2章,第2.9节,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),译 黄芸,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.9 无参数方法

当一个训练数据集不满足任何假定的某种概率分布时,唯一的选择就是通过无参数方法分析数据集。无参数方法不服从概率分布假设。使用无参数方法,我们可以不基于概率分布的前提假设来实施推断和假设检验。现在我们来看当一个数据集不满足任何概率分布前提假设时,可使用的一系列无参数检验。

2.9.1 Wilcoxon符号秩检验

如果正态性假设不成立,就需要利用无参数方法来回答这个问题——自动挡和手动挡汽车的市内平均行车里程数是否有差别?

image

若两个样本恰好成对而又不满足正态性假设,则可使用参数paired:

image

2.9.2 Mann-Whitney-Wilcoxon检验

若两个样本不匹配、独立且不服从正态分布,则需要使用Mann-Whitney-Wilcoxon检验来判断两个样本的平均差有显著差异的假设。

image

2.9.3 Kruskal-Wallis检验

要比较两组以上数据的平均值,也即无参方法的方差分析,可以使用Kruskal-Wallis检验。这也被称作无分布的统计检验:

image

相关文章
|
移动开发 算法 数据可视化
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享(上)
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享
|
存储 机器学习/深度学习 缓存
【数据挖掘】XGBoost面试题:与GBDT的区别?为什么使用泰勒二阶展开?为什么可以并行训练?为什么快?防止过拟合的方法?如何处理缺失值?
XGBoost与GBDT的区别、XGBoost使用泰勒二阶展开的原因、并行训练的原理、速度优势、防止过拟合的策略以及处理缺失值的方法,突出了XGBoost在提升模型性能和训练效率方面的一系列优化。
1142 1
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享(下)
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享
|
数据可视化
R语言机器学习方法分析二手车价格影响因素
R语言机器学习方法分析二手车价格影响因素
|
数据可视化 算法
【R语言实战】——kNN和朴素贝叶斯方法实战
【R语言实战】——kNN和朴素贝叶斯方法实战
|
数据可视化 Python
R语言蒙特卡罗Monte Carlo方法进行数值积分和模拟可视化
R语言蒙特卡罗Monte Carlo方法进行数值积分和模拟可视化
|
机器学习/深度学习 算法 数据库
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
|
算法 数据挖掘
R语言中的贝叶斯统计方法
【4月更文挑战第26天】R语言在贝叶斯统计中发挥着重要作用,提供如"BUGS"、"Stan"、"JAGS"等包来处理复杂模型和数值计算。贝叶斯方法基于概率论,涉及先验分布、似然函数、后验分布和MCMC模拟。"BUGS"适用于复杂层次模型,"Stan"则在大规模数据和复杂模型上有优势。
412 2
|
算法 数据可视化 Windows
R语言BUGS/JAGS贝叶斯分析: 马尔科夫链蒙特卡洛方法(MCMC)采样(2)
R语言BUGS/JAGS贝叶斯分析: 马尔科夫链蒙特卡洛方法(MCMC)采样(2)
|
算法 数据可视化 Python
【视频】逆变换抽样将数据标准化和R语言结构化转换:BOX-COX、凸规则变换方法
【视频】逆变换抽样将数据标准化和R语言结构化转换:BOX-COX、凸规则变换方法

热门文章

最新文章