开发者学堂课程【人工智能必备基础:概率论与数理统计:皮尔森相关系数】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/545/detail/7455
皮尔森相关系数
内容介绍
一.连续变量的相关分析
二.Pearson 相关系数
一.连续变量的相关分析
连续变量即数据变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。如“年龄”、“收入”、“成绩”等变量。当两个变量都是正态连续变量,而且两者之间呈线性关系时,通常用 Pearson 相关系数来衡量
二.Pearson 相关系数
协方差:
协方差是一个反映两个随机变量相关程度的指标,如果一个变量跟随着另一个变量同时变大或者变小,那么这两个变量的协方差就是正值
虽然协方差能反映两个随机变量的相关程度(协方差大干的时候表示两者正相关。小于的时候表示两者负相关),但是协方差值的大小并不能很好地度最两个随机变量的关联程度。
在二维空间中分布着一些数据。我们想知道数据点坐标轴和轴的相关程度。如果与的相关程度较小但是数据分布的比较离散。这样会导致求出的协方差值较大,用这个值来度量相关程度是不合理的
为了更好的度量两个随机变量的相关程度,引入了 Pearson 相关系数,其在协方差的基础上除以了两个随机变量的标准差
pearson 相关系数
pearson 是一个介于 -1 和 1 之间的值,当两个变量的线性关系增强时,相关系数趋于 1 或 -1:当一个变量增大,另一个变量也增大时,表明它们之间是正相关的。相关系数大于 0:如果一个变量增大,另一个变量却减小,表明它们之间是负相关的,相关系数小于 0: 如果相关系数等于 0,表明它们之间不存在线性相关关系。