L4-数字特征:期望、方差、协方差、相关系数等

简介: L4-数字特征:期望、方差、协方差、相关系数等

数字特征是指能够刻画随机变量某些方面的性质特征的量。


(1)期望(mean)


期望也就是均值,是概率加权下的“平均值”,反映的是随机变量平均取值大小。

连续型:


image.png


离散型:image.png


期望的性质:假设C为一个常数,X和Y维两个随机变量,则


E ( C ) = C

E ( C X ) = C E ( X )

E ( X + Y ) = E ( X ) + E ( Y )

X 和Y 相互独立 ⇔ E ( X + Y ) = E ( X ) + E ( Y )


(2)方差(Variance)


方差衡量随机变量或一组数据离散程度的度量,用来度量随机变量和其期望均值之间的偏离程度。


连续型:

image.png

离散型:

image.png

根据期望的定义,

image.png

假设C为一个常数,X和Y是两个随机变量,那么方差有以下性质:


D ( C ) = 0

D ( C X ) = C 2 D ( X )

D ( C + X ) = D ( X ) D(C+X)=D(X)D(C+X)=D(X)


常见分布的期望与方差

20200425142024511.png


(3)标准差(Standard Deviation)


image.png

(4)协方差(Covariance)


协方差用于衡量两个变量的总体误差;当两个变量相同时,协方差就是方差。


image.png

协方差是两个随机变量具有相同方向变化趋势的度量:


若C o v ( X , Y ) > 0 Cov(X,Y)>0Cov(X,Y)>0,则X XX和Y YY变化趋势相同;

若C o v ( X , Y ) > 0 Cov(X,Y)>0Cov(X,Y)>0,则X XX和Y YY变化趋势相反;

若C o v ( X , Y ) = 0 Cov(X,Y)=0Cov(X,Y)=0,则X XX和Y YY不相关。

假设C CC为一个常数,X XX和Y YY是两个随机变量,那么方差有以下性质:


C o v ( X , Y ) = C o v ( Y , X )

C o v ( a X , b Y ) = a b C o v ( X , Y )

C o v (X1+x2  , Y ) = C o v ( X1, Y ) + C o v (x2 Y )


根据方差定义,

image.png

如果X和Y相互独立,则C o v ( X , Y ) = 0,此时D ( X ± Y ) = D ( X ) + D ( Y )

如果C o v ( X , Y ) = 0 ,则X 和Y 不相关(不能推出不独立)


协方差矩阵

n个随机向量{ X1,x2  ,  X 3 , … , X n } ,任意两个元素x i 和x j都可以得到一个协方差,从而形成一个n ∗ n 的矩阵,该矩阵称为协方差矩阵,协方差矩阵为对称矩阵。


image.png


(5)Pearson相关系数


image.png


−1≤ρ(X,Y)≤1


ρ ( X , Y ) > 0 ,则X 和Y 正相关;

ρ ( X , Y ) = 0,则X 和Y 相互独立,并且不存在相关性;

ρ ( X , Y ) < 0 ,则X 和Y负相关。


(6)原点矩与中心矩


假设X XX和Y YY是随机变量,若E ( X k ) , k = 1 , 2 , … 存在,则称它为X 的k阶原点矩,简称k 阶矩。


若E [ X − E ( X ) ] k , k = 1 , 2 , … 存在,则称它为X 的k 阶中心矩。

若E [ X − c ] k , k = 1 , 2 , … 存在,则称它为X 关于点c的k 阶矩。

 E X k Y p , k 、 p = 1 , 2 , … 存在,则称它为X 和Y的k + p k+pk+p阶混合原点矩。

若E [ X − E ( X ) ] k [ Y − E ( Y ) ] p , k 、 p = 1 , 2 , …存在,则称它为X XX和Y YY的k + p k+pk+p阶混合中心矩。


E(X)是X 的一阶原点矩;D ( X ) 是X 的二阶中心矩;C o v ( X , Y ) 是X 和Y的二阶混合中心矩


(7)峰度(peakedness; kurtosis)


峰度又称峰态系数。表示了概率密度分布曲线在平均值处峰值高低的特征数,反映了峰部的尖度。


image.png


σ为方差。


(8)偏度(skewness)


偏度描述分布偏离对称性程度的特征数,当分布左右对称时,偏度系数为0;当偏度系数大于0时,即重尾在右侧时,该分布为右偏;当偏度系数小于0时,即重尾在左侧时,该分布为左偏。

image.png


σ为方差。

相关文章
|
1月前
|
数据可视化
R平方/相关性取决于预测变量的方差
R平方/相关性取决于预测变量的方差
|
1月前
|
大数据
stata具有异方差误差的区间回归
stata具有异方差误差的区间回归
|
1月前
|
数据可视化
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
|
1月前
|
数据采集
R语言用线性模型进行臭氧预测: 加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值
R语言用线性模型进行臭氧预测: 加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值
|
1月前
R语言异方差回归模型建模:用误差方差解释异方差
R语言异方差回归模型建模:用误差方差解释异方差
|
数据可视化 Python
概率学中的随机变量与分布
概率学中的随机变量与分布
概率学中的随机变量与分布
(二)随机变量的数字特征:探索概率分布的关键指标
(二)随机变量的数字特征:探索概率分布的关键指标
|
9月前
|
Ruby
(一)探索随机变量及其分布:概率世界的魔法
(一)探索随机变量及其分布:概率世界的魔法
|
10月前
|
机器学习/深度学习 决策智能
矩阵分析 (七) 矩阵特征值的估计
矩阵分析 (七) 矩阵特征值的估计
124 0
R-ggpmisc|回归曲线添加回归方程,R2,方差表,香不香?
R-ggpmisc|回归曲线添加回归方程,R2,方差表,香不香?