开发者学堂课程【人工智能必备基础:概率论与数理统计:相关分析概述】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/545/detail/7454
相关分析概述
内容介绍
一.相关分析
二.相关系数:
三.示例图
一.相关分析
衡量事物之间或称变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。。比如,家庭收入和支出、一个人所受教育程度与其收入、子女身高和父母身高等
二.相关系数:
1.衡量变量之间相关程度的一个量值
2.相关系数 r 的数值范围是在 一1 到 十1 之间
3.相关系数 r 的正负号表示变化方向。+号表示变化方向一致,即正相关:“-"号表示变化方向相反,即负相关
4.r 的绝对值表示变量之间的密切程度(即强度)。绝对值越接近 1 表示两个变量之间关系越密切:越接近 0,表示两个变量之间关系越不密切。
5.相关系数的值,仅仅是一个比值。它不是由相第单位度量而来(即不等距),也不是百分比,因此,不能直接作加、减、乘、除运算
6.相关系数只能描述两个变带之间的变化方向及密切程度,并不能揭示两者之间的内在本质联系,即存在相关的两个变量,不一定存在因果关系
三.示例图
如果一个变量在另一个变里减小时倾向于增加,则系数为负。上面的相关系数为 -0.93
反之,如果两个变里倾向于同时增加,则相关系数为正。此处的相关系数为 +0.92
相关系数为 +0.23 时,数据点随机分布在直线周围此模型并不能说明大里方差里
相关系数只度量线性关系。即使相关系数为 0,也会存在有意义的非线性关系可通过查看散点图来确定这一点