两独立样本的非参数检验
两独立样本的非参数检验
- 在对总体分布不甚了解的情况下,通过对两个独立样本的分析推断样本来自的两总体的分布是否存在显著差异的方法
- 独立样本是指在从一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本
主要方法
- 曼-惠特尼U检验(Mann-Whitney U)
- K-S检验
- W-W游程检验
- 极端反应检验
注意:
不同分析方法对同一批数据的分析结论有可能不相同。这 一方面说明分析过程中对数据进行反复的探索性分析是极为必 要的;另一方面也说明了不同方法本身侧重点的差异性。
两独立样本的极端反应检验
两独立样本的极端反应检验(Moses Extreme Reactions)
- 原假设H0 :两独立样本来自的两总体的分布无显著差异
- 基本思想:将一个样本作为控制样本,另一个样本作为实验样本,检验实验样本相对于控制样本是否出现了极端反应
- 极端反应:控制样本和实验样本的极值存在显著差异
- 如果没有出现极端反应,则不能拒绝原假设,可以认为两总体的分布无显著差异;相反,如果存在极端反应,则认为两总体的分布存在显著差异
- 计算步骤:
1.首先,将两个样本混合按升序排序
2.然后,求出控制样本的最小秩Qmin和最大秩Qmax,并计算出跨度 (Span):S=Qmax-Qmin+1
3.最后,为消除样本数据中极端值对分析结果的影响,在计算跨度之前可剔除控制样本中的某些观测值,然后再求跨度,得到截头跨度
- 决策:如果概率P值小于等于给定的显著性水平α,则拒绝原假设, 认为样本来自的两总体的分布存在显著差异;反之则接受原假设, 认为样本来自的两总体的分布不存在显著差异。
【案例】 某工厂用甲、乙两种不同的工艺生产同一种产品。如果希望检 验两种工艺下产品的使用寿命的分布是否存在显著差异,可从两种工艺生产出的产品中随机抽样,得到各自的使用寿命数据。
操作步骤:
①选择菜单【分析】----> 【非参数检验】----> 【旧对话框】----> 【2个独立样本】
②选择检验变量、分组变量、检验类型
③点击“确定”,分析结果如下:
结论:由分析结果表可知,跨度和截头跨度(剪除后控制组跨 度)分别为10和6。两种情况下的概率分别为0.084和0.1。如果显著性水平α为0.05,无论是否剔除极端值,都可得出不能拒绝原假设的结论,认为甲、乙两种工艺下产品使用寿命的分布无显著差异。
两配对样本的非参数检验
两配对样本的非参数检验
- 两配对样本的非参数检验是在对总体分布不甚了解的情况下,通过对两配对样本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法
- 常用检验方法
- McNemar检验(检验分析的变量是二值变量)
- McNemar检验采用二项分布检验的方法,计算分布是否服从概率p为0.5的二项分布,最终比较的是单侧P值与α的大小
- 符号检验:采用二项分布检验,最终比较的是单侧P值与α的大小
- Wilcoxon符号秩检验
- 原假设H0:两配对样本来自的两总体的分布无显著差异
【案例1】分析学生在学习统计学课程前后对统计学重要性的认知程度是否发生了显著改变,可以随机收集一批学生在学习统计学前后认为统计学是否重要的样本数据(0表示“不重要”,1表示“重要”)。
①选择菜单【分析】---->【非参数检验】---->【旧对话框】---->【2 个相关样本】
②选择待检验的两个配对变量到【检验对】框中,并选择检验类型
③分析结果
结论:由于双侧的二项分布累计概率为0.687,则单侧概率P值为0.3435, 大于显著性水平α,因此不能拒绝原假设,认为学习前后学生对统计学重要性的认识没有发生显著变化。
【案例2】 为检验某种新的训练方法是否有助于提高跳远运动员的成绩, 收集到10名跳远运动员在使用新训练方法前后的跳远最好成绩。
操作步骤:
①选择菜单【分析】---->【非参数检验】---->【旧对话框】---->【2 个相关样本】
②选择待检验的两个配对变量到【检验对】框中,并选择检验类型
③分析结果
结论:由于双侧的二项分布累计概率为0.180,则单侧概率P值为0.09, 大于显著性水平α,因此不能拒绝原假设,认为训练前后的成绩分布没有显著差异,新训练方法没有显著效果。
结论:对应的概率P值为0.110,大于显著性水平α,因此不能拒 绝原假设,认为训练前后的成绩分布没有显著差异,新训练方法没有显著效果。