协方差与相关系数(标准协方差)

简介: 协方差与相关系数(标准协方差)

正文


协方差的定义


设( X , Y )是二维随机变量,若:

E [ X − E ( X ) ] [ Y − E ( Y ) ]存在,则称它为随机变量X 与Y 的协方差,记为c o v ( X , Y ) ,有

1.png


协方差的性质


c o v ( X , Y ) = c o v ( Y , X )

c o v ( X , X ) = D ( X )

c o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y )

2.png

协方差的定义


设c o v ( X , Y ) cov(X,Y)cov(X,Y)存在,且D ( X ) , D ( Y ) 不为零,则称3.png随机变量X 与Y 的相关系数或标准协方差,记为ρ X Y即



4.png


5.png可得,设

6.png

即 X^*,Y^*分别是X , Y 的标准化随机变量,由协方差的定义,可知

7.png


相关系数的意义


已知ρ X Y 是X , Y的相关系数,则有定理

∣ ρ X Y ∣ ⩽ 1 (ρ X Y  >0称正相关,ρ X Y<0称负相关)

∣ ρ X Y ∣ = 1 的充要条件是:存在常数a , b ,使:

P{Y=aX+b}=1

即X 与Y 以概率1存在线性关系


该定理说明了,相关系数ρ X Y  描述了随机变量X 、Y 的线性相关程度,∣ ρ X Y ∣ 越接近1,则X 与Y 之间越接近线性关系。当∣ ρ ∣ = 1 时,X 与Y 存在线性关系。特别地,如果ρ X Y = 0 则X 与Y不相关,说明X 与Y没有线性关系。


应当注意到,两个随机变量X 与之间的不相关性和相互独立型一般是不同的。

由相关系数的定义可以推导得,当X 与Y 相互独立时,必有ρ X Y = 0 ,即X 与Y 不相关,但反之则不然。

独立性是比不相关性更为严格的条件,独立性反映X与Y 之间不存在任何关系,而不相关性只是就线性关系而已的,即使X 与Y 不相关,它们之间也可能存在某种函数关系。


相关文章
|
5月前
|
机器学习/深度学习 数据采集 人工智能
算法金 | 协方差、方差、标准差、协方差矩阵
**摘要:** 本文介绍了统计学中的基础概念,包括方差、标准差、协方差及其矩阵。方差衡量数据的分散程度,标准差是方差的平方根,提供相同单位下的波动度量。协方差则分析两个变量的关联性,正负值表示正负相关。协方差矩阵扩展到多变量情况,展示多个变量间的关系。这些工具在金融、质量控制、机器学习等领域有广泛应用。文章通过实例和公式清晰解释了每个概念,并强调理解它们之间的关系对于数据分析和统计建模的重要性。
59 0
算法金 | 协方差、方差、标准差、协方差矩阵
程序技术好文:统计学基础(一):中位数、方差、标准差、均方误差、估计量、高斯函数、正态分布
程序技术好文:统计学基础(一):中位数、方差、标准差、均方误差、估计量、高斯函数、正态分布
|
6月前
|
大数据
stata具有异方差误差的区间回归
stata具有异方差误差的区间回归
|
机器学习/深度学习 数据挖掘
09 协方差与相关系数
09 协方差与相关系数
63 0
|
Python
相关系数 r 和决定系数 R2 的那些事
有人说相关系数(correlation coefficient, r)和决定系数(coefficient of determination, R2,读作R-Squared)都是评价两个变量相关性的指标,且相关系数的平方就是决定系数?这种说法对不对呢?请听下文分解!
970 0
离散型随机变量和连续型随机变量及其常见分布(下)
离散型随机变量和连续型随机变量及其常见分布
|
机器学习/深度学习
L4-数字特征:期望、方差、协方差、相关系数等
L4-数字特征:期望、方差、协方差、相关系数等
L4-数字特征:期望、方差、协方差、相关系数等
|
移动开发
概率与信息论:期望、方差、标准差和协方差
概率与信息论:期望、方差、标准差和协方差
214 0