什么是检验对?
检验对的形式 (x1,x2) 出现在两种情况中:
- 对同一实体执行两次测量。例如,一项评估新型胰岛素疗效的临床研究将为每位患者测量两次血糖水平:之前(X1)服药后(X2)。
- 对不同的实体进行测量。但是,实体根据其特征进行匹配。例如,为了测试药物的功效,您可能希望根据体重,年龄或其他特征配对研究参与者,以控制这些混杂因素。
在第一种情况下,配对是数据生成过程的自然结果。在第二种情况下,配对由研究设计强制执行。
为什么依赖测量有用?
使用配对检验,可以控制影响测量结果的混杂因素。因此,配对研究设计通常比涉及独立组的设计更强大。
睡眠数据集
让我们考虑睡眠数据集,举例说明:
data(sleep) print(sleep)
## extra group ID ## 1 0.7 1 1 ## 2 -1.6 1 2 ## 3 -0.2 1 3 ## 4 -1.2 1 4 ## 5 -0.1 1 5 ## 6 3.4 1 6 ## 7 3.7 1 7 ## 8 0.8 1 8 ## 9 0.0 1 9 ## 10 2.0 1 10 ## 11 1.9 2 1 ## 12 0.8 2 2 ## 13 1.1 2 3 ## 14 0.1 2 4 ## 15 -0.1 2 5 ## 16 4.4 2 6 ## 17 5.5 2 7 ## 18 1.6 2 8 ## 19 4.6 2 9 ## 20 3.4 2 10
_extra_表示与基线测量相比睡眠中的增加/减少(正/负值),_组_表示药物,_ID_表示患者ID。为了更清楚,我将_组_重命名为_药物_:
调查睡眠数据集
重要的是要注意每个人都是不同的。因此,相同药物的功效可能因人而异。让我们看看这个数据集中是否也是这种情况:
实际上,个体研究对象的额外睡眠时间分布似乎是双峰的。大约一半的受试者表现出两种药物的睡眠持续时间大幅增加,而另一半受试者几乎没有益处甚至患有药物。使用配对检验,可以校正这些患者间差异,而对于假设测量是独立的测试,这是不可能的。
比较不成对和配对检验
现在让我们比较不成对测试和配对检验对睡眠数据集的执行情况。
Wilcoxon秩和检验
如果我们在测量中使用未配对的Wilcoxon秩和检验(Mann-Whitney U检验),则该检验将产生以下药物顺序以确定显着性:
## \[1\] 1 1 1 1 2 1 2 1 1 2 2 2 2 1 1 2 1 2 2 2 ## Levels: 1 2
我们可以看到,虽然代表性不足,但药物1在最高级别中出现了好几次。这是因为,对于两种药物反应良好的患者,药物1也运作良好。由于依赖药物的额外睡眠时间没有明显的分离,因此测试在5%的水平上不会显着:
## \[1\] 0.06932758
_威尔科克森_符号秩检验
考虑配对的检验值更有意义,因为检验结果不受个体受试者的药物敏感性的影响。我们可以看到,当我们计算患者内额外睡眠差异时,用于未配对Wilcoxon检验的度量:
## \[1\] -1.2 -2.4 -1.3 -1.3 0.0 -1.0 -1.8 -0.8 -4.6 -1.4
非阳性差异清楚地表明药物1在所有研究受试者中都不如药物2。由于Wilcoxon检验基于这些差异,因此发现两种药物在显着性水平为5%时存在显着差异:
# 配对检验 w.unpaired <- wilcox.test(x, y, paired = TRUE) print(w.unpaired$p.value)
`````` ## \[1\] 0.009090698
结论
这个例子说明了为什么分组研究设计优于检验独立的研究设计。当然,仅在使用考虑配对检验的测试来评估数据的情况下才是这种情况。否则,实际上重要的结果可能被错误地视为无关紧要。