L6-假设检验:临界值法与P值法

简介: L6-假设检验:临界值法与P值法

假设检验(hypothesis testing),又称统计假设检验,先做出某种假设,然后通过抽样收集数据进行统计推理,对此假设应该被拒绝还是接受做出推断。


e.g. 某药品X 可以起到降血糖的作用,为检验其药效,随机抽取9 位实验者。记录服药前的血糖值,然后让每位实验者服用该药物,连续服药一周后,再次记录其血糖值度。服药前后血糖差值如下:


1.5 , 0.6 , − 0.3 , 1.1 , − 0.8 , 0 , 2.2 , − 1.0 , 1.4


1. 建立两个完全对立的假设


原假设(零假设)H 0  ,备择假设 (对立假设)H 1


原假设与备择假设是不对称的,决定谁是原假设,依赖于立场、惯例、方便性。


(1)保护原假设:如果错误地拒绝假设A比错误地拒绝假设B带来更严重的后果——A选作原假设。


假设A:新药有某种毒副作用

假设B:新药无某种毒副作用

“有毒副作用”错误地当成“无毒副作用”比“无毒副作用”错误地当成“有毒副作用”带来的后果更严重,因此A选作原假设H 0


(2)原假设为维持现状:为解释某些现象或效果的存在性,原假设常取为“无效果”、“无改进”、“无差异”,等,拒绝原假设表示有较强的理由支持备择假设。


原假设H 0 :药物无效

备择假设H 1: 药物有效


(3)原假设取简单假设:只有一个参数(或分布)的假设称为简单假设.如果只有一个假设是简单假设,将其取为原假设。


参数假设的形式

设θ 是反映总体指标某方面特征的量, 是我们感兴趣的参数,一般参数θ

的假设有三种情形:


H 0 : θ = θ 0H 1 : θ < θ 0(左边检验)

H 0 : θ = θ 0H 1 : θ > θ 0(右边检验)

H 0 : θ =θ 0H 1: θ ≠ θ 0 (右边检验)

其中,H 0: θ ≥ θ 0H 1 : θ < θ 0(左边检验)与H 0 : θ = θ 0 , H 1 : θ < θ 0 (左边检验)的检验法则与检验效果一致。


同理,H 0 : θ ≤θ 0H 1 : θ > θ 0(右边检验)与 H 0 : θ = θ 0H 1: θ > θ 0(右边检验)的检验法则与检验效果一致。


2. 给出检验统计量,并确定拒绝域的形式


如果统计量T = T ( X 1 , . . . , X n ) 的取值大小和原假设H 0是否成立有密切联系,可将其称为对应假设问题的检验统计量,而对应于拒绝原假设H 0 时,样本值的范围称为拒绝域,记为W ,其补集W ˉ 称为接受域。


该例中,设服药前后血糖差值X ∼ N ( μ , σ 2 ) 并假设σ = 0.36


假设检验:H 0  : μ = 0 , H 1 : μ > 0


由于X  是μ的无偏估计,X 的取值大小反映了μ 的取值大小,当原假设成立时(药物无效),X 取值应偏小。


因此


image.png时,拒绝原假设H 0 

image.png时,接受原假设H 0 

本例中检验统计量X ,拒绝域


image.png

关键问题:如何选择C


两类错误


由于样本的随机性,任一检验规则在应用时,都有可能发生错误的判断——两类错误。


image.png


第I 类错误:拒绝真实的原假设(弃真)

第I I类错误:接受错误的原假设(取伪)



α = P {第I类 错 误 } = P { 拒 绝 H 0   ∣ H 0  为 真 }

β = P {第II类 错 误 } = P { 接 受H 0   ∣ H 0  为 假 }


e.g. 总体X ∼ N ( μ , 1 ) ,则


image.png

image.png

犯两类错误的概率相互制约。


Neyman-Pearson原则


首先控制犯第I 类错误的概率不超过某个常数α ∈ ( 0 , 1 ) ,再寻找检验,使得犯第I I类错误的概率尽可能小。α称为显著水平。常取α = 0.01 , 0.05 , 0.1等。


3. 临界值法:根据显著水平和统计量的分布确定临界值


本例中,取显著水平α = 0.05


H 0  : μ = 0 成立时,


image.png


犯第I 类错误的概率


image.png


Φ(−z  0.05 )=0.05,


image.png


根据Neyman-Pearson原则,为使犯第I I 类错误的概率尽可能小,应取C = 0.329 ,因此拒绝域为W = { X ˉ ≥ 0.329 }


4. 根据样本得出结论


根据样本image.png在拒绝域内。


当原假设H 0  成立时,样本落在拒绝域的概率不超过0.05,是小概率事件。根据实际推断原理,有充分的理由拒绝原假设(药物无效),认为药物有效。


同理可验证,若取显著性水平α = 0.01,拒绝域W = { X ˉ ≥ 0.465 } ,依然在拒绝域内,因此拒绝原假设。


5. P值法


P_值:当原假设H 0 成立时,检验统计量取比观察到的结果更为极端的数值的概率,即最小显著性水平。

image.png


通过比较P 值 与显著性水平,得出结论:概率这么小的事件发生了,因此拒绝原假设。


P _值与显著水平α 的关系:


若P _ ≤ α ,等价于样本落在拒绝域内,因此拒绝原假设,称检验结果在水平α下是统计显著的。

若P _ > α ,等价于样本不落在拒绝域内,因此接受原假设,称检验结果在水平α 下是统计不显著的。


小结


(1)临界值法处理假设检验问题的基本步骤


根据实际问题提出原假设和备择假设

提出检验统计量和拒绝域的形式

在给定的显著水平α 下,根据Neyman-Pearson原则求出拒绝域的临界值

根据实际样本观测值做出判断


(2)P _ 值法处理假设检验问题的基本步骤


根据实际问题提出原假设和备择假设

提出检验统计量和拒绝域的形式

计算检验统计量的观测值与P _ 值

根据给定的显著水平α 做出判断


相关文章
|
7月前
|
人工智能 机器人 计算机视觉
当AI有了“分身”:虚拟化身与情感交互的实战指南
当AI有了“分身”:虚拟化身与情感交互的实战指南
567 0
|
编解码 并行计算 物联网
4G显存部署Flux,2分钟Wan2.1-14B视频生成,DiffSynth-Engine引擎开源!
魔搭社区的开源项目 DiffSynth-Studio 自推出以来,凭借其前沿的技术探索和卓越的创新能力,持续受到开源社区的高度关注与广泛好评。截至目前,该项目已在 GitHub 上斩获超过 8,000 颗星,成为备受瞩目的开源项目之一。作为以技术探索为核心理念的实践平台,DiffSynth-Studio 基于扩散模型(Diffusion Model),在图像生成和视频生成领域孵化出了一系列富有创意且实用的技术成果,其中包括 ExVideo、ArtAug、EliGen 等代表性模块。
2047 3
|
算法 搜索推荐 Java
数据结构与算法学习十三:基数排序,以空间换时间的稳定式排序,速度很快。
基数排序是一种稳定的排序算法,通过将数字按位数切割并分配到不同的桶中,以空间换时间的方式实现快速排序,但占用内存较大,不适合含有负数的数组。
348 0
数据结构与算法学习十三:基数排序,以空间换时间的稳定式排序,速度很快。
|
11月前
|
Android开发
Android控件样式的抽取(小提及快捷方式)
在Android开发中,若多个控件样式重复,可抽取公共部分以简化代码。例如对EditText提取样式,通过编辑`styles.xml`实现复用。为提高效率,Android Studio提供自动提取Style功能:右键点击控件样式选项,选择“Style...”,勾选需要提取的属性后确认,即可快速生成样式代码,显著提升开发便利性。
314 2
|
机器学习/深度学习 自然语言处理 并行计算
社区供稿 | Para-Former:DUAT理论指导下的CV神经网络并行化,提速多层模型推理
神经网络正越来越多地朝着使用大数据训练大型模型的方向发展,这种解决方案在许多任务中展现出了卓越的性能。然而,这种方法也引入了一个迫切需要解决的问题:当前的深度学习模型基于串行计算,这意味着随着网络层数的增加,训练和推理时间也会随之增长。
353 28
|
资源调度 监控 JavaScript
使用Yarn创建Grafana模板的完整指南
本文介绍如何使用Yarn生成Grafana模板,涵盖从安装Node.js和Yarn到创建并验证Grafana仪表板的全过程。具体步骤包括:1) 安装Node.js和Yarn;2) 创建Yarn项目;3) 安装Grafana API客户端库;4) 编写模板脚本;5) 生成模板文件;6) 在Grafana中加载并验证模板。通过详细的代码示例和流程图,帮助你轻松完成这一过程。
564 0
|
存储 C语言
C语言:一维数组的不初始化、部分初始化、完全初始化的不同点
C语言中一维数组的初始化有三种情况:不初始化时,数组元素的值是随机的;部分初始化时,未指定的元素会被自动赋值为0;完全初始化时,所有元素都被赋予了初始值。
1635 2
|
机器学习/深度学习 人工智能 自然语言处理
|
监控 Ubuntu 安全
百度搜索:蓝易云【Ubuntu安装Net-tools和SSH】
请注意,这些命令假设您已经具有适当的网络连接,并具有sudo或root权限。根据您的具体环境和要求,可能需要进行其他配置和调整。确保在进行任何与网络和安全相关的操作之前,详细了解您的需求和网络环境,并采取适当的安全措施。
386 1
|
机器学习/深度学习 数据可视化 算法
python数据分析——在面对各种问题时,因如何做分析的分类汇总
Python数据分析是指使用Python编程语言对数据进行收集、处理、分析和可视化的过程。Python是一种非常流行的编程语言,具有简单易学、代码可读性高、生态系统强大的特点,因此在数据科学领域得到广泛应用。
557 0