皮尔森相关系数 | 学习笔记

简介: 快速学习皮尔森相关系数

开发者学堂课程【人工智能必备基础:概率论与数理统计:皮尔森相关系数】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7455


皮尔森相关系数

内容介绍

一.连续变量的相关分析

二.Pearson 相关系数

 

一.连续变量的相关分析

连续变量即数据变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。如“年龄”、“收入”、“成绩”等变量。当两个变量都是正态连续变量,而且两者之间呈线性关系时,通常用 Pearson 相关系数来衡量

 

二.Pearson 相关系数

协方差:

协方差是一个反映两个随机变量相关程度的指标,如果一个变量跟随着另一个变量同时变大或者变小,那么这两个变量的协方差就是正值

image.png

虽然协方差能反映两个随机变量的相关程度(协方差大干的时候表示两者正相关。小于的时候表示两者负相关),但是协方差值的大小并不能很好地度最两个随机变量的关联程度。

在二维空间中分布着一些数据。我们想知道数据点坐标轴和轴的相关程度。如果与的相关程度较小但是数据分布的比较离散。这样会导致求出的协方差值较大,用这个值来度量相关程度是不合理的

image.png

为了更好的度量两个随机变量的相关程度,引入了 Pearson 相关系数,其在协方差的基础上除以了两个随机变量的标准差

pearson 相关系数

image.png

pearson 是一个介于 -1 和 1 之间的值,当两个变量的线性关系增强时,相关系数趋于 1 或 -1:当一个变量增大,另一个变量也增大时,表明它们之间是正相关的。相关系数大于 0:如果一个变量增大,另一个变量却减小,表明它们之间是负相关的,相关系数小于 0: 如果相关系数等于 0,表明它们之间不存在线性相关关系。

image.png

相关文章
程序技术好文:统计学基础(一):中位数、方差、标准差、均方误差、估计量、高斯函数、正态分布
程序技术好文:统计学基础(一):中位数、方差、标准差、均方误差、估计量、高斯函数、正态分布
|
机器学习/深度学习 数据挖掘
09 协方差与相关系数
09 协方差与相关系数
65 0
|
机器学习/深度学习
马修斯相关系数MCC简介
在评估机器学习模型的性能时,F1score都被首选指标。在本文中,我们将介绍一个值得更多关注和认可的替代度量:马修斯相关系数(MCC)。
449 0
|
Python
相关系数 r 和决定系数 R2 的那些事
有人说相关系数(correlation coefficient, r)和决定系数(coefficient of determination, R2,读作R-Squared)都是评价两个变量相关性的指标,且相关系数的平方就是决定系数?这种说法对不对呢?请听下文分解!
1092 0
|
人工智能 开发者
卡方检验 | 学习笔记
快速学习卡方检验
卡方检验 | 学习笔记
|
人工智能 开发者
连续型随机变量 | 学习笔记
快速学习连续型随机变量
连续型随机变量 | 学习笔记
|
人工智能 开发者 Python
泊松分布 | 学习笔记
快速学习泊松分布
泊松分布 | 学习笔记
|
人工智能 开发者
肯德尔系数 | 学习笔记
快速学习肯德尔系数
肯德尔系数 | 学习笔记
|
机器学习/深度学习 算法 开发者
自变量选择1| 学习笔记
快速学习自变量选择1。
自变量选择1| 学习笔记
|
机器学习/深度学习 算法 开发者
自变量选择(2)| 学习笔记
快速学习自变量选择(2)。
自变量选择(2)| 学习笔记