【数理统计】均值检验(双侧、单侧)和区间估计

简介: 【数理统计】均值检验(双侧、单侧)和区间估计

1区间估计是什么?


在统计推断中有两类问题,一类为估计问题,一类为假设检验。估计问题中主要包括点估计和区间估计,点估计是估计出一个分布中未知参数的值,区间估计则是估计出一个分布中未知参数所在的范围。


区间估计最终要估计出未知参数所在的区间,这个区间就是经常听到的置信区间


注意置信水平并非概率(如95%:我们有信心说(置信的意思),如果通过100次采样,采用同样的区间深度,得到100个置信区间,那么平均有95个包含μ)


2 均值检验


在区间估计中,当总体为正态分布时,常见的区间估计场景有以下几种。


2.1 方差已知,估计均值

U检验(Z检验)步骤

Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法(总体的方差已知)。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。


Z检验步骤:


第一步: 建立原假设 H0:μ = μ0 ,即先假定两个平均数之间没有显著差异


第二步: 计算统计量U(Z),对于不同类型的问题选用不同的统计量计算方法

  • 如果检验一个样本平均数(X)与一个已知的总体平均数(μ0)的差异是否显著。其Z值计算公式为:

image.png

  • 其中:X是检验样本的均值;μ0是已知总体均值;σ是总体的标准差;n是样本容量。


第三步:判断拒绝域


第四步:带入数据计算统计量,并判断是否落在拒绝域内,得出结论。


关于置信区间计算(通过下方截图,有助于理解)

image.png


2.2 方差未知,估计均值

  • 用t检验
  • 大样本(n>=30),用u检验(z检验)


其他部分类似。


总结如下:

image.png


2.3 t检验与u检验区别

u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。


理论上要求样本来自正态分布总体。


但在实用时,只要满足大样本,或总体标准差σ已知 时,就可应用 u检验 ;


n小且总体标准差σ未知时 ,可应用 t检验 ,但要求样本来自正态分布总体。两样本均数比较时还要求两总体方差相等。


References

常用的假设检验方法(U检验、T检验、卡方检验、F检验

目录
相关文章
|
5月前
|
人工智能 算法
算法金 | 平均数、众数、中位数、极差、方差,标准差、频数、频率 一“统”江湖
**统计学江湖概要** - **平均数(均值)**:数字的总和除以数量,代表集中趋势,如分赃时平均分配。 - **众数**:出现次数最多的数字,反映了最常见的值,如同一招式被频繁使用。 - **中位数**:排序后位于中间的值,反映数据的中心位置,如同武者武功的中等水平。 - **极差**:最大值减最小值,表示数据波动范围,类似武功最高与最低的差距。 - **方差**:衡量数据波动性,计算每个数值与均值差的平方和的平均数。 - **标准差**:方差的平方根,同单位的波动度量。 - **频数**:某个值出现的次数,如统计武器使用情况。 - **频率**:频数与总次数的比例,显示出现的相对频率。
103 2
算法金 | 平均数、众数、中位数、极差、方差,标准差、频数、频率 一“统”江湖
【概率论基础】Probability | 数学性概率 | 统计性概率 | 几何概率 | 概率论三大公理
【概率论基础】Probability | 数学性概率 | 统计性概率 | 几何概率 | 概率论三大公理
124 0
|
7月前
|
大数据
stata具有异方差误差的区间回归
stata具有异方差误差的区间回归
|
7月前
|
数据可视化
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
|
7月前
贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据
贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据
贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据
|
7月前
|
算法
R语言非线性方程数值分析生物降解、植物生长数据:多项式、渐近回归、米氏方程、逻辑曲线、Gompertz、Weibull曲线(上)
R语言非线性方程数值分析生物降解、植物生长数据:多项式、渐近回归、米氏方程、逻辑曲线、Gompertz、Weibull曲线
|
7月前
R语言非线性方程数值分析生物降解、植物生长数据:多项式、渐近回归、米氏方程、逻辑曲线、Gompertz、Weibull曲线(下)
R语言非线性方程数值分析生物降解、植物生长数据:多项式、渐近回归、米氏方程、逻辑曲线、Gompertz、Weibull曲线
|
7月前
|
机器学习/深度学习 算法 数据挖掘
K-均值算法
K-均值算法是发现给定数据集的k个簇的算法。簇个数k是用户给定的,每一个簇通过其簇中所有点的中心点来描述 工作流程: 首选选取样本中k个样本作为每个簇的簇中心 然后对每一个样本与每个簇之间的关系,来分配到每一个簇中 然后更新每个簇的均值
69 1
【数理统计】一题了解拟合优度检验
【数理统计】一题了解拟合优度检验
333 0
【数理统计】一题了解拟合优度检验