开发者社区> 问答> 正文

怎么进行假设检验?

怎么进行假设检验?

展开
收起
游客llo7cvgk4x5jg 2022-04-01 14:56:51 1969 0
1 条回答
写回答
取消 提交回答
  • 网络规划设计师、敏捷专家、CISP、ITSS服务经理、ACA全科目、ACP4项、ACE、CBP、CDSP、CZTP等。拥有 PRINCE2 Foundation/Practitioner、CCSK、ITIL、ISO27001、PMP等多项国际认证。 专利5+、期刊10+、知识产权师。核心期刊审稿人。

    您好,1.根据实际问题提出一对假设(包括原假设和备择假设)

    原假设也称为零假设(null hypothesis),记为H0;备择假设又称为备选假设(alternative hypothesis),记为H1。

    零假设和备择假设中的假设一般都用比较符号(>、<、≥、≤、≠)来表示的,其中,带有等号的符号只出现在零假设中。

    在选择零假设和备择假设时,通常遵循如下原则:①把研究者要证明的假设作为备择假设;②将所作出的声明作为原假设;③把现状作为原假设;④把不能轻易否定的假设作为原假设。

    2.确定检验统计量

    检验统计量是指我们用来决策(拒绝或不能拒绝零假设)时所依据的样本统计量。有了两个假设,就需要构造某个适当的检验统计量,并确定其在零假设成立时的分布,并根据观测的样本计算检验统计量的值。对不同的问题和数据,我们要采取不同的统计量,在对总体的均值进行检验时,大样本应用正态分布检验,计算z统计量,小样本一般用t分布检验,计算t统计量。

    3.确定显著性水平α

    显著性水平就是允许的小概率水平,但小概率并不能说不明不会发生,仅仅是发生的概率小罢了。统计推断中的假设检验是依据样本的数据信息对于总体参数的某种假设进行判断,由于样本的信息与总体参数的真实情况不完全一致,无论我们做出拒绝或不拒绝原假设的结论,都有可能犯错误。

    拒绝正确零假设的错误常被称为第一类错误(type Ⅰerror)或弃真错误(α)。有第一类错误,就有第二类错误,即当备选假设正确时反而说零假设正确的错误,称为第二类错误(type Ⅱ error)或取伪错误(β)。假设检验的决策结论及其后果有以下四种情况。

    假设检验决策结论及其后果

    对于两类错误的分析,要注意只有拒绝原假设时,才有可能犯第一类错误,只有不拒绝原假设时,才有可能犯第二类错误。由于检验决策只能是在拒绝原假设和不拒绝原假设中选择其一,所以不可能同时犯两类错误。当然也不是必然会犯这两类错误,很多情况下我们的决策是正确的,没有犯错误。在一般的假设检验问题中,犯第一类错误的概率最大不超过α,但是由于备择假设往往不是一个点,所以无法算出犯第二类错误的概率β。在其他条件不变的情况下,假设检验的两类错误有此消彼长的关系,即减小α会引起β增大,反之亦然。

    扩大样本量可以同时减小犯两类错误的概率,但样本量的扩大取决于调查目的、调查成本、调查时间等多种因素。一般情况下,人们认为犯第一类错误的后果更严重一些,因此通常会取一个较小的α值。奈曼—皮尔逊(Neyman Pearson)提出了一个原则:“在控制犯第一类错误的概率不超过指定值α的条件下,尽量使犯第二类错误β小”。按这种法则做出的检验称为“显著性检验”。

    假设检验中通常首先控制第一类错误的概率不超过某个小概率水平,在满足该条件的要求下使犯第二类错误的概率尽量小。著名的英国统计学家费希尔(Fisher)在他的研究中把小概率的标准定为0.05,所以人们通常选择显著性水平为0.05或比0.05更小的概率。

    4.确定决策规则

    在构造了检验统计量在零假设成立时的分布之后,给定显著性水平α就可以确定假设检验的拒绝域,从而建立一个决策准则。根据事先给定的显著性水平α,可以在统计量的分布上找到相应的临界值(critical value),由显著性水平和相应的临界值确定的一个区域称为拒绝域(rejection region)。如果统计量的值落在拒绝域内就拒绝原假设,否则就不能拒绝原假设。

    拒绝域的大小与显著性水平有关。当样本量固定时,拒绝域随α的减小而减小。除了通过比较检验统计量与其临界值的大小来决定是否拒绝零假设之外,我们还可以通过计算假设检验的p值并与给定显著性水平α相比较来判断原假设的真伪。

    p值(P value)是一种概率,它是当原假设为真时所得到的样本观察结果或更极端结果出现的概率,是观测到的显著性水平或拒绝原假设的最小显著性水平。如果p值小于或等于α,说明在原假设为真时发生了一个出现概率比事先给定的小概率还小的小概率事件,而如果原假设为真,这是不可能发生的时间,由此我们可以认定原假设不真,就可以拒绝原假设;反之,就表明在原假设为真的假定条件下,小概率事件并没有发生,检验统计量的实际样本值在一次抽样中出现完全是有可能的,拒绝原假设的证据不足,因此我们不能拒绝原假设。P值越小,我们拒绝原假设的理由越充分。但是要注意,“不能拒绝零假设”不同于“接受零假设”。

    总结上述的检验决策准则:

    双侧检验:∣统计量的值∣>临界值,或p ≤ α时,拒绝原假设;

    左侧检验:统计量的值 < -临界值,或p ≤ α时,拒绝原假设;

    右侧检验:统计量的值 > 临界值,或p ≤ α时,拒绝原假设;

    通过对以上假设检验过程的介绍,我们可以对假设检验进行一下总结:

    ①假设检验依据的是小概率原理。出现此概率的情况小于我们想象的概率时就拒绝原假设。

    ②小概率标准在抽样前依照需要来确定。多小的概率为小,即小概率“小”的程度由研究者事先规定。

    ③假设检验的结果只能是拒绝或不拒绝原来假设,而不能证明原假设成立。大概率事件不能证明假设成立,因为出现这种情况的总体不是唯一的,但出现小概率事件在很大程度上说明原假设不成立。不能否定原假设时,只是目前的证据不足以否定假设,但不能说原假设就是对的

    ④统计假设检验的结果不是绝对正确。统计结果不能教条地理解,不是以绝对的把握否定什么或肯定什么,只是在概率的意义上成立。依据样本的信息对关于总体的假设做出判断,无论是拒绝还是不拒绝,都有可能犯错。

    这就是统计假设检验背后的哲学思想。

    2022-05-14 12:06:15
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
概率图模型 立即下载
理解过拟合 立即下载
纯干货 | 机器学习中梯度下降法的分类及对比分析 立即下载