【数理统计】一题了解假设检验

简介: 【数理统计】一题了解假设检验

0 目的(意义)


假设检验和参数估计都是推断统计的重要内容,但是两者的角度不同:

参数估计是利用样本信息推断未知的总体参数;

假设检验是先对总体参数提出一个假设,然后利用信息进行验证。


1基础知识


1.1 原假设与备择假设

  • 原假设:除非收集充足的证据证明其错误,否则都不予以拒绝的假设,也称之为零假设,一般用H0来表示
  • 备择假设:只有收集到足够的证据证明其正确才会被接受的假设,也称为研究假设。


1.2 两类错误

image.png

假设嫌疑犯面临死刑判决,我们假设如下:H0:无罪,H1:有罪


那么这两类错误相当于:

  • 第一类错误:错杀了好人
  • 第二类错误:放走了坏人


从这里可以看出,第一类错误更严重(人死不能复生,而坏人放了还可以再抓)。在实际应用中也是,首先控制第一类错误,然后再去控制第二类错误(因为这两个错误的发生概率不能同时降低)。


1.3 置信水平与显著性水平

首先,置信水平和置信度应该是一样的,就是变量落在置信区间的可能性,“置信水平”就是相信变量在设定的置信区间的程度,是个0~1的数,用1-α表示。

置信区间,就是变量的一个范围,变量落在这个范围的可能性是就是1-α。

显著性水平就是变量落在置信区间以外的可能性,“显著”就是与设想的置信区间不一样,用α表示。


显然,显著性水平与置信水平的和为1。

显著性水平为0.05时,α=0.05,1-α=0.95

如果置信区间为(-1,1),即代表变量x在(-1,1)之间的可能性为0.95。

0.05和0.01是比较常用的,但换个数也是可以的,计算方法还是不变。


总之,置信度越高,显著性水平越低,代表假设的可靠性越高,越好。


1.4 检验统计量

前面文章有叙述过,可回顾。

image.png


1.5 拒绝域

拒绝域大小与显著性水平有关。如果检验统计量落入拒绝域,拒绝原假设。否则就接受原假设。


1.6标准正态分布表

0d7c6ffcfd5c4df7855f3f1771ed3b61.png


2 假设检验的流程


例题:在一家餐饮公司中长期以来,顾客从点餐到上菜平均要等待10min。该餐厅经理为了检验最近餐厅的服务情况,对最近一周顾客平均等餐时间进行调查。


2.1 提出原假设和备择假设

  • 原假设:μ=10min
  • 备择假设:μ≠10min


2.2 确定显著性水平及样本容量

该经理根据实际情况确定显著性水平α=0.05,样本容量n=100


2.3抽取样本获得样本数据(样本均值、方差)

抽取100个顾客,将他们的等餐时间作为一个样本,发现

image.png

2.4检验统计量

选择检验统计量,需要根据样本情况来选择。

  • 总体方差已知——Z检验
  • 总体方差未知
  1. 大样本——Z检验
  2. t检验

例题中总体方差未知,但n>30为大样本,因此使用Z检验。

image.png

带入数值得,z=1.714.


这也意味着点估计量(X拔)与假设的总体参数(平均上菜时间10min)相差了1.714个标准差的距离


2.5做出统计决策

在得到样本统计量之后,我们需要针对其做出统计决策。方法有两种:

  1. 临界值法
  2. p值法


第一种方法是我们考试中经常考察的。


临界值法

根据实现给定的显著性水平,就可以在统计量分布上找到相应的临界值,一般查表可知。


在上述例题中,由于采用双侧检验的方法,根据显著性水平α=0.05,可得对应的临界值为1.96。该样本的检验统计量为1.71,没有落入拒绝域。


因此,不拒绝原假设,即可以认为上菜平均等待时间不超过10min。


用临界值法进行决策的优点是界限清晰,但是无法给出观测数据与原假设之间不一致程度的精确度量,为了精确反应决策的风险程度,可以利用下方的P值法。


P值法

方法:在已知p值得条件下,将其与给定的显著性水平α的值进行比较,来确定是否拒绝原假设。


如果p值<α,拒绝H0;如果p值>α,接受H0.

image.png


例题中,z=1.714,通过查表可知统计量的值大于1.714的概率为:


1-0.956=0.044,


由于是双侧检验,所以p值为0.044+0.044=0.088>α,因此不拒绝H0.


利用p值进行决策的方法给出了犯错误的实际概率,这是临界值法所不具备的,因此在实际中P值法更为常用。


References

1、假设检验的基本概念 (matongxue.com)

2、《商务统计分析》机械工业出版社

目录
相关文章
|
5月前
|
算法 Java C++
试题 算法训练 整数拆分
试题 算法训练 整数拆分
45 0
|
4月前
线性代数——(期末突击)概率统计习题(概率的性质、全概率公式)
线性代数——(期末突击)概率统计习题(概率的性质、全概率公式)
32 1
|
人工智能 算法
算法提高:组合数学| 容斥原理常见应用
容斥原理常见的问题如下。 (1) 篮球、羽毛球、网球三种运动,至少会一种的有22人,会篮球的有15人,会羽毛球的有17人,会网球的有12人,既会篮球又会羽毛球的有11人,既会羽毛球又会网球的有7人,既会篮球又会网球的有9人,那么三种运动都会的有多少人? (2) 《西游记》《三国演义》《红楼梦》三大名著,至少读过其中一本的有20人,读过《西游记》的有10人,读过《三国演义》的有12人,读过《红楼梦》的有15人,读过《西游记》《三国演义》的有8人,读过《三国演义》《红楼梦》的有9人,读过《西游记》《红楼梦》的有7人。问三本书全都读过的有多少人?
136 0
算法提高:组合数学| 容斥原理常见应用
|
5月前
|
算法 Java C++
试题 算法训练 二元函数
试题 算法训练 二元函数
35 0
概率论|贝叶斯公式及其推论的理解和运用
概率论|贝叶斯公式及其推论的理解和运用
162 0
|
容器
数学|泊松分酒问题蕴藏的数学知识
数学|泊松分酒问题蕴藏的数学知识
172 0
【数理统计】一题了解拟合优度检验
【数理统计】一题了解拟合优度检验
286 0
【数理统计】一题了解拟合优度检验
【数理统计】从协方差到相关系数,原来如此
【数理统计】从协方差到相关系数,原来如此
136 0
【数理统计】从协方差到相关系数,原来如此
|
算法
数学知识:求组合数(一)
复习acwing算法基础课的内容,本篇为讲解数学知识:求组合数,关于时间复杂度:目前博主不太会计算,先鸽了,日后一定补上。
130 0
数学知识:求组合数(一)
|
算法
数学知识:求组合数(二)
复习acwing算法基础课的内容,本篇为讲解数学知识:求组合数,关于时间复杂度:目前博主不太会计算,先鸽了,日后一定补上。
124 0
数学知识:求组合数(二)
下一篇
无影云桌面