【数理统计】均值检验(双侧、单侧)和区间估计

简介: 【数理统计】均值检验(双侧、单侧)和区间估计

1区间估计是什么?


在统计推断中有两类问题,一类为估计问题,一类为假设检验。估计问题中主要包括点估计和区间估计,点估计是估计出一个分布中未知参数的值,区间估计则是估计出一个分布中未知参数所在的范围。


区间估计最终要估计出未知参数所在的区间,这个区间就是经常听到的置信区间


注意置信水平并非概率(如95%:我们有信心说(置信的意思),如果通过100次采样,采用同样的区间深度,得到100个置信区间,那么平均有95个包含μ)


2 均值检验


在区间估计中,当总体为正态分布时,常见的区间估计场景有以下几种。


2.1 方差已知,估计均值

U检验(Z检验)步骤

Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法(总体的方差已知)。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。


Z检验步骤:


第一步: 建立原假设 H0:μ = μ0 ,即先假定两个平均数之间没有显著差异


第二步: 计算统计量U(Z),对于不同类型的问题选用不同的统计量计算方法

  • 如果检验一个样本平均数(X)与一个已知的总体平均数(μ0)的差异是否显著。其Z值计算公式为:

image.png

  • 其中:X是检验样本的均值;μ0是已知总体均值;σ是总体的标准差;n是样本容量。


第三步:判断拒绝域


第四步:带入数据计算统计量,并判断是否落在拒绝域内,得出结论。


关于置信区间计算(通过下方截图,有助于理解)

image.png


2.2 方差未知,估计均值

  • 用t检验
  • 大样本(n>=30),用u检验(z检验)


其他部分类似。


总结如下:

image.png


2.3 t检验与u检验区别

u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。


理论上要求样本来自正态分布总体。


但在实用时,只要满足大样本,或总体标准差σ已知 时,就可应用 u检验 ;


n小且总体标准差σ未知时 ,可应用 t检验 ,但要求样本来自正态分布总体。两样本均数比较时还要求两总体方差相等。


References

常用的假设检验方法(U检验、T检验、卡方检验、F检验

目录
相关文章
|
6月前
|
机器学习/深度学习 存储 PyTorch
PyTorch内存优化的10种策略总结:在有限资源环境下高效训练模型
在大规模深度学习模型训练中,GPU内存容量常成为瓶颈,特别是在训练大型语言模型和视觉Transformer时。本文系统介绍了多种内存优化策略,包括混合精度训练、低精度训练(如BF16)、梯度检查点、梯度累积、张量分片与分布式训练、
226 14
PyTorch内存优化的10种策略总结:在有限资源环境下高效训练模型
|
11月前
|
网络架构
直通和交叉电缆:网络连接的桥梁
【10月更文挑战第15天】
492 5
|
SQL 存储 数据库
SQL 语言:基本概述和数据定义
SQL 语言:基本概述和数据定义
502 4
|
JavaScript Java 测试技术
基于SpringBoot+Vue的电商数据分析的详细设计和实现(源码+lw+部署文档+讲解等)
基于SpringBoot+Vue的电商数据分析的详细设计和实现(源码+lw+部署文档+讲解等)
180 0
|
人工智能 小程序 前端开发
小程序源码|户外旅游小程序源码模版
小程序源码|户外旅游小程序源码模版
512 2
|
域名解析 存储 网络协议
基于 Wireshark 分析 UDP 协议
基于 Wireshark 分析 UDP 协议
|
存储 设计模式 JSON
日志管理系统,多种方式总结
好记性不如好Log。项目中日志的管理是基础功能之一,不同的用户和场景下对日志都有特定的需求,从而需要用不同的策略进行日志采集和管理,如果是在分布式的项目中,日志的体系设计更加复杂。
942 0
日志管理系统,多种方式总结
|
域名解析 缓存 网络协议
阿里云DNS常见问题之新买的域名生效很慢如何解决
阿里云DNS(Domain Name System)服务是一个高可用和可扩展的云端DNS服务,用于将域名转换为IP地址,从而让用户能够通过域名访问云端资源。以下是一些关于阿里云DNS服务的常见问题合集:
|
JavaScript 前端开发 网络架构
Vue-router的动态路由:获取传递的值
Vue-router的动态路由:获取传递的值
144 0
|
移动开发 前端开发 JavaScript
分享79个Html前端模板,总有一款适合您
分享79个Html前端模板,总有一款适合您
317 0