违背基本假设6| 学习笔记

简介: 快速学习违背基本假设6。

开发者学堂课程【机器学习算法 :违背基本假设6】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7209


违背基本假设6

 

内容介绍:

一、常见不满足基本假设的情况

 

一、 常见不满足基本假设的情况

image.png

1. 异方差

2. 自相关

3. 异常值

回归分析中,一些异常或者极端的观测值可能会引起较大的残差,影响回归拟合的结果。

image.png

异常值成因

消除方法

数据录入错误

重新核实数据

数据测量错误

重新测量数据

数据随机误差

删除、或者重新观测数据

缺少重要自变量

增加相应自变量

缺少观测数据

增加观测数据

存在异方差

消除异方差,如加权回归等

模型选择错误

更改模型,如改成非线性回归

异常值的常见情况:

因变量 y 出现异常值:一般认为残差超过 image.png 即为异常值。

标注化残差:image.png

删除残差:image.png

学生化残差:image.png,其中image.png 为杠杆值,为帽子矩阵 image.png 的主对角线元素

删除学生化残差:image.png,P 为自变量个数,image.png的观测值被认为是异常值

自变量 X 出现异常值

image.png 为杠杆值,表示自变量第i次观测值与自变量平均值之间的距离,杠杆值 image.png 大的样本点为强影响电。刚感知的平均值 image.pngimage.png 大于2倍或3倍的平均值 image.png 时,被认为是大的

库克距离:image.png反应了 image.png 与残差的综合效应,当 image.png 不是异常值,当 image.png 是异常值

image.png

相关文章
|
3月前
|
算法
聊聊一个面试中经常出现的算法题:组合运算及其实际应用例子
聊聊一个面试中经常出现的算法题:组合运算及其实际应用例子
|
4月前
|
设计模式 算法 开发者
软件复用问题之区分「不重复」和「复用」,如何解决
「不重复」和「复用」之间有何区别软件复用问题之区分「不重复」和「复用」,如何解决
|
PHP 开发者
|
安全 搜索推荐
如何避免写重复代码?两种常见的方法:抽象和组合
如何避免写重复代码?两种常见的方法:抽象和组合
245 0
|
SQL 缓存 安全
如何避免写重复代码:善用抽象和组合
通过抽象和组合,我们可以编写出更加简洁、易于理解和稳定的代码;类似于金字塔的建筑过程,我们总是可以在一层抽象之上再叠加一层,从而达到自己的目标。但是在日常的开发工作中,我们如何进行实践呢?本文将以笔者在Akka项目中的一段社区贡献作为引子分享笔者的一点心得。
160 0
如何避免写重复代码:善用抽象和组合
|
机器学习/深度学习 算法 开发者
违背基本假设5| 学习笔记
快速学习违背基本假设5。
违背基本假设5| 学习笔记
|
机器学习/深度学习 算法 开发者
违背基本假设-1| 学习笔记
快速学习违背基本假设-1。
违背基本假设-1| 学习笔记
|
机器学习/深度学习 算法 开发者
违背基本假设-4| 学习笔记
快速学习违背基本假设-4。
违背基本假设-4| 学习笔记
|
机器学习/深度学习 算法 开发者
违背基本假设-2| 学习笔记
快速学习违背基本假设-2。
违背基本假设-2| 学习笔记
|
机器学习/深度学习 供应链 算法
违背基本假设-3| 学习笔记
快速学习违背基本假设-3。
违背基本假设-3| 学习笔记