比较检验2| 学习笔记

简介: 快速学习比较检验2。

开发者学堂课程【机器学习算法 :比较检验2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7179


比较检验2

 

内容介绍

一、假设检验

二、假设检验步骤

 

一、假设检验

统计假设检验:事先对总体的参数或者分布做一个假设,然后基于已有的样本数据去判断这个假设是否合理。即样本和总体假设之间的不同是纯属机会变异(因为随机性误差导致的不同),还是两者确实不同。常用的假设检验方法有 t- 检验法,x2 检验法(卡方检验)、F- 检验法等。

基本思想:

1、从样本推断整体

2、通过反证法推断假设是否成立

3、小概率事件在一次实验中基本不会发生

4、不轻易拒绝原假设

5、通过显著性水平定义小概率事件不可能发生的概率

6、全称命题只能被定义而不能被证明(所谓全称命题是指一切全部等等不太容易一个一个验证的,没有办法证实,只要找到一个部分,就能证明这个命题错误;但是要证明这个命题是正确,就很费劲了)

 

二、假设检验步骤

图片2.png

1、建立假设

根据具体问题,建立假设:

(1)原假设(空假设,0假设):根据描述作出假设,这个假设是希望收集证据希望推翻的假设,是一个全称命题,记作 H0(做了一个假设之后,并不是为了证明假设成立,而是为了把假设推翻)

(2)备择假设:收集证据予以支持的假设(很难便利所有的证据证明备择假设成立,但是只要是原假设不成立,那备择假设就成立了,两者互为逆命题),记作 H1

(3)假设的形式(命题中会有显示):

双尾检验:

图片3.png

(原假设里面是相等,从两侧来检验)

左侧单尾检验:

图片4.png

右侧单尾检验:

 图片5.png

(只有小概率事件发生了,才拒绝原假设,检验过程保护原假设)

2、确定检验水准

检验水准:又称显著性水平,记作 α,是指原假设正确,但是最终被拒绝的概率。在做检验的过程中,会犯两种错误:

(1)原假设为真,被拒绝,称作第一类错误,其概率记作 α,即为显著性水平,取值通常为0.05、0.025、0.01等(检验水平不一样)

(2)原假设为假,被接受,称作第二类错误,其概率记作 β,即为检验功效。

显著水平 α=0.05 的意思是:在原假设正确的情况下进行100次抽样,有5次错误拒绝了原假设。

3、构造统计量

根据资料类型、研究设计方案和统计推断的目的,选用适当检验方法的计算相应的统计量。

常见的检验方法:

t 检验:小样本(<30),总体标准差σ未知的正态分布

F 检验:即方差分析,检验两个正态随机变量的总体方差是否相等的一种假设检验的方法

Z 检验:大样本(>=30)平均值差异性检验,又称 u 检验

X2 检验:即卡方检验。用于非参数检验,主要是比较两个及两个以上样本率以及两个分类变量的关联性分析。(确定假设,确定检验水准,然后要收集证据,简单的说就是需要构造一个统计量)如果想要继续了解,可以参考下面这本书。

图片6.png

图片7.png

4、计算 P 值

关于 P 值:

(1)用来判定假设检验结果的参数,和显著性水平 α 相比

(2)在原假设为真的前提下出现观察样本以及更极端情况的概率(如果原来的假设是真的,当前事情会发生的概率是多少)

(3)如果 P 值很小。说明原假设出现的概率很小,应该拒绝(假设不对),p值越小,拒绝原假设的理由越充足。

5、得到结论

(1)如果 P 值小于等于显著水平 α,表面 x 小概率事件发生,拒绝原假设(否则也不能说明原假设成立)

图片8.png

(2)统计量的值如果落在拒绝区域内或者临界值,则拒绝原假设,落在接受域则不能拒绝原假设。

检验一下掷硬币的例子:建立假设硬币没有问题,每次出现正面是事实,但是我们更倾向于硬币有问题。所以原假设设为没有问题(原假设是需要我们推翻的假设)。需要做一个女士投掷硬币的统计量,满足二项式分布。如果硬币没有问题, P 值就是0.0009<0.05,就是小概率发生的。就是说硬币实际上是有问题的。

如果女士说连续掷硬币两次正面向上,原假设是硬币没有问题,α=0.0.5,构造统计量,计算 p 值,p=0.25>0.05,这是判断不能拒绝原假设,但是也不能证明硬币没有问题,所以需要收集更多的数据。

相关文章
|
6月前
信效度检验(SPSS
信效度检验(SPSS
357 0
|
机器学习/深度学习 算法 大数据
机器学习:Friedman检验与Nemenyi后续检验,Python实现
机器学习:Friedman检验与Nemenyi后续检验,Python实现
1181 0
机器学习:Friedman检验与Nemenyi后续检验,Python实现
|
6月前
|
算法
正态性检验方法汇总
正态性检验方法汇总
|
6月前
|
C++
R语言Wald检验 vs 似然比检验
R语言Wald检验 vs 似然比检验
|
6月前
狄克逊(Dixon)检验
狄克逊(Dixon)检验
481 0
|
6月前
|
数据挖掘
SPSS游程检验
SPSS游程检验
98 0
|
数据挖掘 Python
python数据分析 - T检验与F检验:二组数据那个更好?(一)
python数据分析 - T检验与F检验:二组数据那个更好?(一)
226 0
|
机器学习/深度学习 算法 开发者
比较检验-3| 学习笔记
快速学习比较检验-3。
比较检验-3| 学习笔记
|
机器学习/深度学习 算法 开发者
比较检验| 学习笔记
快速学习比较检验。
比较检验| 学习笔记