假设检验中的两类错误 | 学习笔记

简介: 快速学习假设检验中的两类错误

开发者学堂课程【人工智能必备基础:概率论与数理统计:假设检验中的两类错误】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7451


假设检验中的两类错误

内容介绍

一. 假设检验中的两类错误

二. 实例

三. a 错误出现原因

四. β 错误出现原因

五. a 错误概率计算

六. β 错误的概率计算

七. 总结

 

一.假设检验中的两类错误

第一类错误(弃真错误):

原假设为真时拒绝原假设。

第一类错误的概率为 a

第二类错误(取伪错误):

原假设为假时接受原假设

第二类错误的概率为 β

image.png

没有办法让两类错误同时减小

image.png


二. 实例

一个公司有员工 3000 人(研究的总体),为了检验公司员工工资统计报表的真实性,研究者作了 50 人的大样本随机抽样调查,人均收入的调查结果是; X(样本均值)=871元: S(标准差)=21 元问能否认为统计报表中人均收入=880 元 的数据是真实的?(显著性水平 α=0.05 )

原假设 HO: 调查数据 871 元与报表数据 880 元之间没有显著性差异,公司员工工资均值的真实情况为 880 元。假设 H1: 调查数据和报表数据之间有显著性的差品,公司员工工资均值的直实情况不是 880元

 

三.a 错误出现原因

我们只抽了一个样本,而个别的样本可能是特殊的,不管你的抽样多么符合科学抽样的要求。理论上讲。在 3000 个员工中随机抽取 50 人作为调查样本,有很多种构成样本的可能性,相当于 3000 选 50,这个数目是很大的。这样,在理论上就有存在很多个样本平均数。也就是说,由于小概率事件的出现,我们把本来真实的原假设拒绝了。这就是 a 错误出现的原因。

 

四.β 错误出现原因

第二个问题是,统计检验的逻辑犯了从结论推断前提的错误。命题是由命题经演绎推论出来的,或写作符号 A→B,命题 C 是我们在检验中所依据操作法则。如果 A是真的,且我们从 A 到 B 的演绎推论如果也是正确的,那么可能是真实的。相反,如果结果 B 是真实的,那么就不能得出 A 必定是真实的结论。这就是 β 错误出现的原因。

 

五.a 错误概率计算

由实际推原理引起的。即“小概率事件不会发生”的假定所引起的,所以有理由将所有小概率事件发生的概率之和或者即显著性水平 (a=0.05) 看作 a 错误发生的

概率,换言之,a 错误发生的概率为检验所选择的显著性水平。如果是单侧检验,弃真错误的概率则为 a/2。

 

六.β 错误的概率计算

犯错误的概率的计算是比较复杂的,由于错误的出现原因是属于逻辑上的,所以在总体参数不知道的情况下是无法计算它出现概率的大小的。我们在以上例了的基础上进一步设计;这个公司职员的实际工资不是 880 元,而是是 870 元,原假设为伪,仍然假设实际工资是 880 元。这样我们就可以在总体均值为 870 元和 880 元两种情况下,分别作出两条正态分布曲线( A 线和 B 线)

image.png

犯错误的概率大小就是相对正态曲线 A 而言,图 1 中阴影部分的面积: ZX1=1.41;ZX2=5.59

查标准正态分布表可知,=(ZX2)Ф(ZX1)=00793 结果表明,如果总体的真值为 870元,而虚无假设为 880 元的话,那么,平均而言每 100 次抽样中,将约有8次把真实情况当作 880 元被接受,即犯B错误的概率大小是 0.0793。

 

七.总结

犯第一类错误的危害较大,由于报告了本来不存在的现象,则因此现象而衍生出的后续研究、应用的危害将是不可估量的。想对而言,第二类错误的危害则相对较小,因为研究者如果对自己的假设很有信心,可能会重新设计实验,再次来过,直到得到自己满意的结果(但是如果对本就错误的观点坚持的话,可能会演变成第一类错误)。

相关文章
|
3月前
|
资源调度 数据可视化 算法
贝叶斯统计是一种基于贝叶斯定理的统计学方法,它不同于传统的频率派统计(或称为经典统计)。
贝叶斯统计是一种基于贝叶斯定理的统计学方法,它不同于传统的频率派统计(或称为经典统计)。
|
5月前
|
机器学习/深度学习 运维 算法
【视频】检测异常值的4种方法和R语言时间序列分解异常检测
【视频】检测异常值的4种方法和R语言时间序列分解异常检测
|
5月前
|
测试技术
数据分享|R语言回归,虚拟变量和交互项,假设检验:F检验、AIC和 BIC分析学生成绩数据附自测题(下)
数据分享|R语言回归,虚拟变量和交互项,假设检验:F检验、AIC和 BIC分析学生成绩数据附自测题
|
5月前
|
机器学习/深度学习 数据可视化
|
5月前
|
数据可视化
r语言中如何进行两组独立样本秩和检验
r语言中如何进行两组独立样本秩和检验
|
5月前
|
C++
【SPSS】游程检验-变量值随机性检验和两独立样本的W-W游程检验详细操作教程(附案例实战)
【SPSS】游程检验-变量值随机性检验和两独立样本的W-W游程检验详细操作教程(附案例实战)
198 0
|
5月前
【SPSS】两独立样本的极端反应检验和两配对样本的非参数检验详细操作教程(附案例实战)
【SPSS】两独立样本的极端反应检验和两配对样本的非参数检验详细操作教程(附案例实战)
145 0
|
5月前
|
数据挖掘 C++
【SPSS】单样本K-S检验和两独立样本K-S检验详细操作教程(附案例实战)
【SPSS】单样本K-S检验和两独立样本K-S检验详细操作教程(附案例实战)
693 0
|
5月前
|
数据挖掘
SPSS两独立样本t检验
SPSS两独立样本t检验
111 0
|
10月前
|
机器学习/深度学习 数据挖掘 Python
统计回归模型中的一些概念解释
统计回归模型中的一些概念解释
112 0
下一篇
无影云桌面