协方差与相关系数(标准协方差)

简介: 协方差与相关系数(标准协方差)

正文


协方差的定义


设( X , Y )是二维随机变量,若:

E [ X − E ( X ) ] [ Y − E ( Y ) ]存在,则称它为随机变量X 与Y 的协方差,记为c o v ( X , Y ) ,有

1.png


协方差的性质


c o v ( X , Y ) = c o v ( Y , X )

c o v ( X , X ) = D ( X )

c o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y )

2.png

协方差的定义


设c o v ( X , Y ) cov(X,Y)cov(X,Y)存在,且D ( X ) , D ( Y ) 不为零,则称3.png随机变量X 与Y 的相关系数或标准协方差,记为ρ X Y即



4.png


5.png可得,设

6.png

即 X^*,Y^*分别是X , Y 的标准化随机变量,由协方差的定义,可知

7.png


相关系数的意义


已知ρ X Y 是X , Y的相关系数,则有定理

∣ ρ X Y ∣ ⩽ 1 (ρ X Y  >0称正相关,ρ X Y<0称负相关)

∣ ρ X Y ∣ = 1 的充要条件是:存在常数a , b ,使:

P{Y=aX+b}=1

即X 与Y 以概率1存在线性关系


该定理说明了,相关系数ρ X Y  描述了随机变量X 、Y 的线性相关程度,∣ ρ X Y ∣ 越接近1,则X 与Y 之间越接近线性关系。当∣ ρ ∣ = 1 时,X 与Y 存在线性关系。特别地,如果ρ X Y = 0 则X 与Y不相关,说明X 与Y没有线性关系。


应当注意到,两个随机变量X 与之间的不相关性和相互独立型一般是不同的。

由相关系数的定义可以推导得,当X 与Y 相互独立时,必有ρ X Y = 0 ,即X 与Y 不相关,但反之则不然。

独立性是比不相关性更为严格的条件,独立性反映X与Y 之间不存在任何关系,而不相关性只是就线性关系而已的,即使X 与Y 不相关,它们之间也可能存在某种函数关系。


相关文章
|
14天前
|
数据可视化
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
15 1
|
15天前
|
数据可视化
R平方/相关性取决于预测变量的方差
R平方/相关性取决于预测变量的方差
18 4
|
6月前
|
机器学习/深度学习 数据挖掘
09 协方差与相关系数
09 协方差与相关系数
28 0
|
6月前
|
机器学习/深度学习 算法
24 正态分布和最大熵
24 正态分布和最大熵
40 0
|
8月前
|
Python
相关系数 r 和决定系数 R2 的那些事
有人说相关系数(correlation coefficient, r)和决定系数(coefficient of determination, R2,读作R-Squared)都是评价两个变量相关性的指标,且相关系数的平方就是决定系数?这种说法对不对呢?请听下文分解!
150 0
|
10月前
概率论--数学期望与方差--协方差(详解)
概率论--数学期望与方差--协方差(详解)
|
12月前
|
vr&ar
离散型随机变量和连续型随机变量及其常见分布(下)
离散型随机变量和连续型随机变量及其常见分布
|
12月前
|
机器学习/深度学习
离散型随机变量和连续型随机变量及其常见分布(上)
离散型随机变量和连续型随机变量及其常见分布
|
移动开发
概率与信息论:期望、方差、标准差和协方差
概率与信息论:期望、方差、标准差和协方差
156 0