正文
协方差的定义
设( X , Y )是二维随机变量,若:
E [ X − E ( X ) ] [ Y − E ( Y ) ]存在,则称它为随机变量X 与Y 的协方差,记为c o v ( X , Y ) ,有
协方差的性质
c o v ( X , Y ) = c o v ( Y , X )
c o v ( X , X ) = D ( X )
c o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y )
协方差的定义
设c o v ( X , Y ) cov(X,Y)cov(X,Y)存在,且D ( X ) , D ( Y ) 不为零,则称随机变量X 与Y 的相关系数或标准协方差,记为ρ X Y即
由可得,设
即 X^*,Y^*分别是X , Y 的标准化随机变量,由协方差的定义,可知
相关系数的意义
已知ρ X Y 是X , Y的相关系数,则有定理
∣ ρ X Y ∣ ⩽ 1 (ρ X Y >0称正相关,ρ X Y<0称负相关)
∣ ρ X Y ∣ = 1 的充要条件是:存在常数a , b ,使:
P{Y=aX+b}=1
即X 与Y 以概率1存在线性关系
该定理说明了,相关系数ρ X Y 描述了随机变量X 、Y 的线性相关程度,∣ ρ X Y ∣ 越接近1,则X 与Y 之间越接近线性关系。当∣ ρ ∣ = 1 时,X 与Y 存在线性关系。特别地,如果ρ X Y = 0 则X 与Y不相关,说明X 与Y没有线性关系。
应当注意到,两个随机变量X 与之间的不相关性和相互独立型一般是不同的。
由相关系数的定义可以推导得,当X 与Y 相互独立时,必有ρ X Y = 0 ,即X 与Y 不相关,但反之则不然。
独立性是比不相关性更为严格的条件,独立性反映X与Y 之间不存在任何关系,而不相关性只是就线性关系而已的,即使X 与Y 不相关,它们之间也可能存在某种函数关系。