数字特征是指能够刻画随机变量某些方面的性质特征的量。
(1)期望(mean)
期望也就是均值,是概率加权下的“平均值”,反映的是随机变量平均取值大小。
连续型:
离散型:
期望的性质:假设C为一个常数,X和Y维两个随机变量,则
E ( C ) = C
E ( C X ) = C E ( X )
E ( X + Y ) = E ( X ) + E ( Y )
X 和Y 相互独立 ⇔ E ( X + Y ) = E ( X ) + E ( Y )
(2)方差(Variance)
方差衡量随机变量或一组数据离散程度的度量,用来度量随机变量和其期望均值之间的偏离程度。
连续型:
离散型:
根据期望的定义,
假设C为一个常数,X和Y是两个随机变量,那么方差有以下性质:
D ( C ) = 0
D ( C X ) = C 2 D ( X )
D ( C + X ) = D ( X ) D(C+X)=D(X)D(C+X)=D(X)
常见分布的期望与方差
(3)标准差(Standard Deviation)
(4)协方差(Covariance)
协方差用于衡量两个变量的总体误差;当两个变量相同时,协方差就是方差。
协方差是两个随机变量具有相同方向变化趋势的度量:
若C o v ( X , Y ) > 0 Cov(X,Y)>0Cov(X,Y)>0,则X XX和Y YY变化趋势相同;
若C o v ( X , Y ) > 0 Cov(X,Y)>0Cov(X,Y)>0,则X XX和Y YY变化趋势相反;
若C o v ( X , Y ) = 0 Cov(X,Y)=0Cov(X,Y)=0,则X XX和Y YY不相关。
假设C CC为一个常数,X XX和Y YY是两个随机变量,那么方差有以下性质:
C o v ( X , Y ) = C o v ( Y , X )
C o v ( a X , b Y ) = a b C o v ( X , Y )
C o v (X1+x2 , Y ) = C o v ( X1, Y ) + C o v (x2 , Y )
根据方差定义,
如果X和Y相互独立,则C o v ( X , Y ) = 0,此时D ( X ± Y ) = D ( X ) + D ( Y )
如果C o v ( X , Y ) = 0 ,则X 和Y 不相关(不能推出不独立)
协方差矩阵
n个随机向量{ X1,x2 , X 3 , … , X n } ,任意两个元素x i 和x j都可以得到一个协方差,从而形成一个n ∗ n 的矩阵,该矩阵称为协方差矩阵,协方差矩阵为对称矩阵。
(5)Pearson相关系数
−1≤ρ(X,Y)≤1
ρ ( X , Y ) > 0 ,则X 和Y 正相关;
ρ ( X , Y ) = 0,则X 和Y 相互独立,并且不存在相关性;
ρ ( X , Y ) < 0 ,则X 和Y负相关。
(6)原点矩与中心矩
假设X XX和Y YY是随机变量,若E ( X k ) , k = 1 , 2 , … 存在,则称它为X 的k阶原点矩,简称k 阶矩。
若E [ X − E ( X ) ] k , k = 1 , 2 , … 存在,则称它为X 的k 阶中心矩。
若E [ X − c ] k , k = 1 , 2 , … 存在,则称它为X 关于点c的k 阶矩。
若 E X k Y p , k 、 p = 1 , 2 , … 存在,则称它为X 和Y的k + p k+pk+p阶混合原点矩。
若E [ X − E ( X ) ] k [ Y − E ( Y ) ] p , k 、 p = 1 , 2 , …存在,则称它为X XX和Y YY的k + p k+pk+p阶混合中心矩。
E(X)是X 的一阶原点矩;D ( X ) 是X 的二阶中心矩;C o v ( X , Y ) 是X 和Y的二阶混合中心矩
(7)峰度(peakedness; kurtosis)
峰度又称峰态系数。表示了概率密度分布曲线在平均值处峰值高低的特征数,反映了峰部的尖度。
σ为方差。
(8)偏度(skewness)
偏度描述分布偏离对称性程度的特征数,当分布左右对称时,偏度系数为0;当偏度系数大于0时,即重尾在右侧时,该分布为右偏;当偏度系数小于0时,即重尾在左侧时,该分布为左偏。
σ为方差。