08 方差与标准差

简介: 08 方差与标准差

方差

概率论和统计学中,一个随机变量的方差(Variance)描述的是它的离散程度,也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶矩或二阶中心动差,恰巧也是它的二阶累积量。方差的算术平方根称为该随机变量的标准差。

其定义为:如果E(X)是随机变量X的期望值(平均数) 设为服从分布F的随机变量,则称为随机变量或者分布的方差:

其中,μ为平均数,N为样本总数。

分别针对离散型随机变量和连续型随机变量而言,方差的分布律和概率密度如下图所示:

标准差

标准差(Standard Deviation),在概率统计中最常使用作为统计分布程度(statistical dispersion)上的测量。标准差定义为方差的算术平方根,反映组内个体间的离散程度。

简单来说,标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。例如,两组数的集合 {0, 5, 9, 14} 和 {5, 6, 8, 9} 其平均值都是 7 ,但第二个集合具有较小的标准差。

前面说过,方差的算术平方根称为该随机变量的标准差,故一随机变量的标准差定义为:

须注意并非所有随机变量都具有标准差,因为有些随机变量不存在期望值。 如果随机变量X为具有相同概率,则可用上述公式计算标准差。上述方差.标准差等相关内容,可用下图总结之:

样本标准差

在真实世界中,除非在某些特殊情况下,找到一个总体的真实的标准差是不现实的。大多数情况下,总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。说白了,就是数据海量,想计算总体海量数据的标准差无异于大海捞针,那咋办呢?抽取其中一些样本作为抽样代表呗。

而从一大组数值当中取出一样本数值组合,进而,我们可以定义其样本标准差为:

样本方差是对总体方差的无偏估计。 中分母为 n-1 是因为的自由度为n-1(且慢,何谓自由度?简单说来,即指样本中的n个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以自由度就是估计总体参数时独立数据的数目,而平均数是根据n个独立数据来估计的,因此自由度为n),这是由于存在约束条件

目录
相关文章
|
5月前
|
机器学习/深度学习 数据采集 人工智能
算法金 | 协方差、方差、标准差、协方差矩阵
**摘要:** 本文介绍了统计学中的基础概念,包括方差、标准差、协方差及其矩阵。方差衡量数据的分散程度,标准差是方差的平方根,提供相同单位下的波动度量。协方差则分析两个变量的关联性,正负值表示正负相关。协方差矩阵扩展到多变量情况,展示多个变量间的关系。这些工具在金融、质量控制、机器学习等领域有广泛应用。文章通过实例和公式清晰解释了每个概念,并强调理解它们之间的关系对于数据分析和统计建模的重要性。
66 0
算法金 | 协方差、方差、标准差、协方差矩阵
|
机器学习/深度学习 数据挖掘
09 协方差与相关系数
09 协方差与相关系数
65 0
|
数据格式
SPSS计算偏度、峰度、平均值、极值、中位数、标准差
本文介绍基于SPSS软件的经典统计学分析与偏度、峰度等常用统计学指标的计算方法~
4104 1
SPSS计算偏度、峰度、平均值、极值、中位数、标准差
|
移动开发
概率与信息论:期望、方差、标准差和协方差
概率与信息论:期望、方差、标准差和协方差
219 0
|
Python
Python编程:方差、标准差、均方差、均方根值、均方误差、均方根误差
Python编程:方差、标准差、均方差、均方根值、均方误差、均方根误差
321 0
Python编程:方差、标准差、均方差、均方根值、均方误差、均方根误差
|
C++
202104-2邻域均值
202104-2邻域均值
78 0
 202104-2邻域均值
|
Python
09 numpy 聚合函数 - 极值,方差,标准差
=== 聚合函数定义 === 对一组数据进行操作,如取均值、最大值等 scores = np.random.randint(1,9,[2,3]) scores array([[3, 2, 8],[4, 3, 3]]) == 最大值 max == axis 指定轴:0竖着的计算,1横着的计算 print(scores.
2224 0
|
机器学习/深度学习