假设检验多重比较的P值修正

简介: 在进行假设检验时,我们通常会使用P值来判断样本数据是否支持原假设。当我们进行多重比较时,也就是对多个假设进行检验时,如果不进行P值修正,就会出现多重比较问题。多重比较问题指的是在进行多次假设检验时,由于进行多次检验,就会增加发生假阳性的概率,从而导致P值的误判。这种误判可能会导致我们错误地拒绝原假设或者错误地接受备择假设,从而影响数据分析的准确性和可靠性。为了避免多重比较问题,进行P值修正可以有效地避免多重比较问题的发生。

1、关于多重比较的P值修正

当对于一组数据进行多重均值比较的时候,例如两两比较(A,B,C)三组数据,将执行3次比较(A-B,A-C,B-C),假设每次比较时犯错的概率假设控制在5%,每次比较的可信度即为95%。但是对于三个同时进行的 test 来说,由于其中每个test的检验犯错是概率5%,那么总体上三个test均正确反映事实的可信度将低于95%(0.953 = 0.85),也即是犯 I类错误** (错误识别为出现显著差异) 的概率从5%提高到了15%。所以在进行多重检验时需要进行P值的修正来控制错误率, 主要有两种控制方案:

方案一 :控制FWER(family-wise error rate)

该类修正方法严格 要求多重比较的每个 test 全部正确,FWER的常见修正方法包括 Bonferroni ,Holm,Scheffe,Tukey。使用校正后的P值的显著性判断水平还是α = 0.05 。

Bonferroni校正,该方法它将显著性水平 α 除以总比较次数n 来生成更低的 α阈值 作为显著性判断水平(α=αn=αC2num_groups)。该方法对于组数比较敏感,适用于比较组数较少的情况(3组,4组,6组),当比较组数过多时(>8组)可能发生因为 α 过小而失效的问题,即使两组间存在差异也无法正确识别,从而放大了 II类错误

如果是对一组数据任意两两组都进行检验,检验功效比较好的是 Tukey 方法,这也是一种相对严格的一种方法,比较不容易得显著的结果。

方案二 :控制FDR(false discovery rate)::控制错误率

该类修正方法要求 在判断显著的这些比较结果里面一定比例的检验结果是可靠的 ,也就是不严格要求所有结果均正确,允许犯错。适用于比较组数较大的情况,如单细胞研究里基因间的两两比较,这种情况下如果使用FWER校正方法可能会出现所有结果都不显著,从而导致比较失去意义。

最常用方法是: Benjamini & Hochberg(BH)


Reference

【统计学博士教你用R语言做统计分析!】方差分析(ANOVA)_哔哩哔哩_bilibili
BH方法过程

目录
打赏
0
0
0
0
185
分享
相关文章
在C++语言中非修正算法
在C++语言中非修正算法
79 1
深入理解多重共线性:基本原理、影响、检验与修正策略
本文将深入探讨多重共线性的本质,阐述其重要性,并提供有效处理多重共线性的方法,同时避免数据科学家常犯的陷阱。
128 3
lintsampler:高效从任意概率分布生成随机样本的新方法
在实际应用中,从复杂概率密度函数(PDF)中抽取随机样本的需求非常普遍,涉及统计估计、蒙特卡洛模拟和物理仿真等领域。`lintsampler` 是一个纯 Python 库,旨在高效地从任意概率分布中生成随机样本。它通过线性插值采样算法,简化了复杂分布的采样过程,提供了比传统方法如 MCMC 和拒绝采样更简便和高效的解决方案。`lintsampler` 的设计目标是让用户能够轻松生成高质量的样本,而无需复杂的参数调整。
87 1
lintsampler:高效从任意概率分布生成随机样本的新方法
如何应对缺失值带来的分布变化?探索填充缺失值的最佳插补算法
该文探讨了缺失值插补的不同方法,比较了它们恢复数据真实分布的效果。文章指出,处理插补尤其在小样本或复杂数据时是个挑战,需要选择能适应数据分布变化的方法。文中介绍了完全随机缺失(MCAR)、随机缺失(MAR)和非随机缺失(MNAR)三种机制,并以一个简单的例子展示了数据分布变化。文章通过比较均值插补、回归插补和高斯插补,强调了高斯插补在重现数据分布方面更优。评估插补方法时,不应仅依赖于RMSE,而应关注分布预测,使用如能量距离这样的指标。此外,即使在随机缺失情况下,数据分布也可能因模式变化而变化,需要考虑适应这些变化的插补方法。
303 2
|
10月前
多重比较示例:Bonferroni校正法和Benjamini & Hochberg法
多重比较示例:Bonferroni校正法和Benjamini & Hochberg法
|
10月前
stata对包含协变量的模型进行缺失值多重插补分析
stata对包含协变量的模型进行缺失值多重插补分析
|
10月前
R语言多重比较示例:Bonferroni校正法和Benjamini & Hochberg法
R语言多重比较示例:Bonferroni校正法和Benjamini & Hochberg法
|
10月前
R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系
R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系
wustojc4004百分制分数转换为等级
wustojc4004百分制分数转换为等级
55 0
为什么以及如何在多重假设检验中调整 P 值
为什么以及如何在多重假设检验中调整 P 值
407 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等