比较检验-3| 学习笔记

简介: 快速学习比较检验-3。

开发者学堂课程【机器学习算法 :比较检验-3】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7180


比较检验-3

 

内容介绍

一、假设检验的例子:二项式检验

二、T 检验

三、原理

四、假设检验在模型比较中的应用

 

一、假设检验的例子:二项式检验

某工厂的一批产品,其次品率 μ 未知,按规定,如果 μ≤0.01,则该批产品可以接受。随机取样品100个,发现有3件次品,该批次产品是否达标?

如果不用假设检验,会发现100个样品会有三个次品。次品率是0.03,不达标。但是其中有一些不确定因素。这些因素会不会有影响?

确定假设:我们搜集数据是为了找到不达标的证据,即原假设Ho:μ<=0.0.1,备择假设H1:μ>0.01

确定检验水平:采取最常用的 α=0.05,或者严格的 α=0.01

构造统计量:产品是否符合二项式分布,原假设成立,则满足 b(k;n,001)

计算 P 值:即

图片9.png

得到结论:P 值大于显著水平 α,不能拒绝原假设(不能说次品率大于0.01),即通过本次采样得到的样本数据,并不能证明原假设 H0 不成立。

不能证明 H0 不成立,也不能证明 H0 成立。总之目前次品率到底是低于0.01还是高于0.01,在没有数据之前,没有任何结论。所以假设结论是和直觉没有关系的,是有区别的。

 

二、T 检验

某网站为了搞了一波市场活动,活动前一周的 PV(单位:万)为 1.40, 1.38, 1.43, 1.42,1.44,1.37,1.41,活动后六天的 PV(单位:万)为 1.35,1.40, 1.42, 1.36, 1.38,1.40。活动对 PV 有无彤响?

假设活动前后 PV 均符合正态分布,且方差相同。(这个问题比较常见)

确定假设:(双维检测)通过数据证明两者不同,即原假设 H0:U1=U2,备择假设 H1:U1 不等于 U2

确定检验水平:采取最常用的 α=0.05

构造统计量:两者均符合正态分布,且相等,方差未知(小于30个),使用T检验;Y 检验量如下:代入求T检验量的值为:T=1.525

图片10.png

接下来查表:

图片11.png

自由度是11.所以查出来是2.201.

计算 P 值,确定拒绝域:查 T 分布临界值表,T0.025/4=2.201,所以有T<T0.025/4,即P>0.05

得出结论:P 值大于显著水平 α。不能拒绝原假设。即无法证明活动有效。(不能拒绝原假设,需要收集更多的数据来进一步检验活动效果)

 

三、原理

1、原假设怎样设定;(相等,不相等,差异性)

2、提高,增加,降低如何选择;

3、原假设是希望收集数据推翻的,如果假设成立(当前的事情发生的概率大小,当然我们希望当前假设将原假设推翻)。如果证据无法推翻原假设,那就既证明原假设成立,也不能证明原假设不成立。

 

四、假设检验在模型比较中的应用

以一元线性回归为例,可以使用假设检验作如下比较和推断:

1、回归系数的显著性检验:y=β0+β1x(判断回归系数有无价值)

(1)检验自变量 x 对因变量 y 的影响程度是否显著(若影响不显著 β1 这一项就可以取消,说明 y 和 x 没有关系)

(2)假设误差 ε 满足均值为0的正态分布,原假设:H0:β1=0 备择假设:H:β1 不等于0

(3)使用 T 检验,如果原假设成立,则x和y并无线性关系(我们希望推翻 β1=0,可以证明 x 和y有关系)

2、回归方程的显著性检验:y=β0+β1x(检验方程本身有没有意义,原假设 β1=0.注意:一元线性回归只有一个参数,所以检测回归方程和回归系数是一致的;如果是多元就不一样)

(1)根据平方和分解式从回归效果检验回归方程的显著性

(2)原假设:16:β1=0 备择假设:H1:β1不等于0

(3)使用F检验,如果原假设成立,则说明回归方程不显著,该方程并无实质意义

3、相关系数的显著性检验

(1)检验两变量之间是否真正相关,或两个相关系数之间的差异是否显著

(2) 原假设:Ho:ƿ=0 备择假设:H1:ƿ+0(只要确定原假设,确定统计量即可)

相关文章
|
9月前
|
负载均衡 Kubernetes 网络协议
注册中心如何选型?Eureka、Zookeeper、Nacos怎么选
这是小卷对分布式系统架构学习的第9篇文章,继续探讨注册中心的原理及选型。文章详细介绍了Eureka、Nacos的工作机制与特点,并对比了Eureka、Nacos、Consul和Zookeeper在一致性协议、健康检查、负载均衡等方面的差异。最后根据不同的应用场景给出了注册中心的选型建议,帮助读者理解如何选择最适合的注册中心。
702 100
|
关系型数据库 MySQL
mysql中有大量sleep进程的原因与解决办法
mysql中有大量sleep进程的原因与解决办法
1049 0
|
7月前
|
Rust 物联网 数据处理
Rust +时序数据库 TDengine:打造高性能时序数据处理利器
TDengine 是一款专为物联网、车联网、工业互联网等时序数据场景优化设计的开源时序数据库,支持高并发写入、高效查询及流式计算,通过“一个数据采集点一张表”与“超级表”的概念显著提升性能。 Rust 作为一门系统级编程语言,近年来在数据库、嵌入式系统、分布式服务等领域迅速崛起,以其内存安全、高性能著称,与 TDengine 的高效特性天然契合,适合构建高可靠、高性能的数据处理系统。
250 2
|
7月前
|
人工智能 自然语言处理 安全
探秘能源行业AI密码:云鼎科技用大模型实现了″四个转变″
大模型正全面赋能流程工业与智能制造。以煤矿行业为例,云鼎科技自2022年起探索大模型应用,从验证到研发再到推广,构建了“1+4+N”智能化方案,实现115类场景落地,并拓展至化工、电力等领域。大模型带来“四个改变”:由被动监管转向本质安全、劳动密集转向精简高效、粗放管理转向质量效益、分散重复转向集约高效。实际成效显著,如兴隆庄煤矿减少岗位人员39人,济宁二号井煤矿每年增利400多万。云鼎科技还基于DeepSeek等模型打造垂域矿山大模型,推动全产业智能化升级,助力企业轻松算清经济账,吸引更多企业拥抱大模型浪潮。
139 0
|
Android开发 Kotlin
kotlin开发安卓app,如何让布局自适应系统传统导航和全面屏导航
使用`navigationBarsPadding()`修饰符实现界面自适应,自动处理底部导航栏的内边距,再加上`.padding(bottom = 10.dp)`设定内容与屏幕底部的距离,以完成全面的布局适配。示例代码采用Kotlin。
343 15
|
存储 Python
NumPy数据类型与转换指南
【4月更文挑战第17天】NumPy是Python的数值计算库,提供多种数据类型如整数(int8, int32等),浮点数(float16, float64等),复数(complex64, complex128)和布尔(bool)。使用`astype()`方法可转换数组数据类型,例如`int_array.astype(np.float64)`。NumPy还会在运算中自动进行类型转换。注意转换可能涉及数据丢失、精度降低及性能影响,需根据需求谨慎选择数据类型。
|
Android开发
07. 【Android教程】Android 线性布局 LinearLayout
07. 【Android教程】Android 线性布局 LinearLayout
364 0
|
编译器 C++
devc++ 问题小总结
devc++ 问题小总结
617 0
elementui源码学习之仿写一个el-tag
elementui源码学习之仿写一个el-tag
397 0
|
资源调度 Kubernetes 监控
如何可视化编写和编排你的k8s任务
阿里任务调度SchedulerX和云原生结合,重磅推出可视化k8s任务,针对脚本使用者,屏蔽了容器服务的细节,不用构建镜像就可以让不熟悉容器的同学(比如运维和运营同学)玩转k8s Job,受益容器服务带来的降本增效福利。针对容器使用者,SchedulerX不但完全兼容原生的k8s Job,还能支持历史执行记录、日志服务、重跑任务、报警监控、可视化任务编排等能力,为企业级应用保驾护航
1622 1