开发者学堂课程【机器学习算法 :比较检验2】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/535/detail/7179
比较检验2
内容介绍
一、假设检验
二、假设检验步骤
一、假设检验
统计假设检验:事先对总体的参数或者分布做一个假设,然后基于已有的样本数据去判断这个假设是否合理。即样本和总体假设之间的不同是纯属机会变异(因为随机性误差导致的不同),还是两者确实不同。常用的假设检验方法有 t- 检验法,x2 检验法(卡方检验)、F- 检验法等。
基本思想:
1、从样本推断整体
2、通过反证法推断假设是否成立
3、小概率事件在一次实验中基本不会发生
4、不轻易拒绝原假设
5、通过显著性水平定义小概率事件不可能发生的概率
6、全称命题只能被定义而不能被证明(所谓全称命题是指一切全部等等不太容易一个一个验证的,没有办法证实,只要找到一个部分,就能证明这个命题错误;但是要证明这个命题是正确,就很费劲了)
二、假设检验步骤
1、建立假设
根据具体问题,建立假设:
(1)原假设(空假设,0假设):根据描述作出假设,这个假设是希望收集证据希望推翻的假设,是一个全称命题,记作 H0(做了一个假设之后,并不是为了证明假设成立,而是为了把假设推翻)
(2)备择假设:收集证据予以支持的假设(很难便利所有的证据证明备择假设成立,但是只要是原假设不成立,那备择假设就成立了,两者互为逆命题),记作 H1
(3)假设的形式(命题中会有显示):
双尾检验:
(原假设里面是相等,从两侧来检验)
左侧单尾检验:
右侧单尾检验:
(只有小概率事件发生了,才拒绝原假设,检验过程保护原假设)
2、确定检验水准
检验水准:又称显著性水平,记作 α,是指原假设正确,但是最终被拒绝的概率。在做检验的过程中,会犯两种错误:
(1)原假设为真,被拒绝,称作第一类错误,其概率记作 α,即为显著性水平,取值通常为0.05、0.025、0.01等(检验水平不一样)
(2)原假设为假,被接受,称作第二类错误,其概率记作 β,即为检验功效。
显著水平 α=0.05 的意思是:在原假设正确的情况下进行100次抽样,有5次错误拒绝了原假设。
3、构造统计量
根据资料类型、研究设计方案和统计推断的目的,选用适当检验方法的计算相应的统计量。
常见的检验方法:
t 检验:小样本(<30),总体标准差σ未知的正态分布
F 检验:即方差分析,检验两个正态随机变量的总体方差是否相等的一种假设检验的方法
Z 检验:大样本(>=30)平均值差异性检验,又称 u 检验
X2 检验:即卡方检验。用于非参数检验,主要是比较两个及两个以上样本率以及两个分类变量的关联性分析。(确定假设,确定检验水准,然后要收集证据,简单的说就是需要构造一个统计量)如果想要继续了解,可以参考下面这本书。
4、计算 P 值
关于 P 值:
(1)用来判定假设检验结果的参数,和显著性水平 α 相比
(2)在原假设为真的前提下出现观察样本以及更极端情况的概率(如果原来的假设是真的,当前事情会发生的概率是多少)
(3)如果 P 值很小。说明原假设出现的概率很小,应该拒绝(假设不对),p值越小,拒绝原假设的理由越充足。
5、得到结论
(1)如果 P 值小于等于显著水平 α,表面 x 小概率事件发生,拒绝原假设(否则也不能说明原假设成立)
(2)统计量的值如果落在拒绝区域内或者临界值,则拒绝原假设,落在接受域则不能拒绝原假设。
检验一下掷硬币的例子:建立假设硬币没有问题,每次出现正面是事实,但是我们更倾向于硬币有问题。所以原假设设为没有问题(原假设是需要我们推翻的假设)。需要做一个女士投掷硬币的统计量,满足二项式分布。如果硬币没有问题, P 值就是0.0009<0.05,就是小概率发生的。就是说硬币实际上是有问题的。
如果女士说连续掷硬币两次正面向上,原假设是硬币没有问题,α=0.0.5,构造统计量,计算 p 值,p=0.25>0.05,这是判断不能拒绝原假设,但是也不能证明硬币没有问题,所以需要收集更多的数据。