违背基本假设6| 学习笔记

简介: 快速学习违背基本假设6。

开发者学堂课程【机器学习算法 :违背基本假设6】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7209


违背基本假设6

 

内容介绍:

一、常见不满足基本假设的情况

 

一、 常见不满足基本假设的情况

image.png

1. 异方差

2. 自相关

3. 异常值

回归分析中,一些异常或者极端的观测值可能会引起较大的残差,影响回归拟合的结果。

image.png

异常值成因

消除方法

数据录入错误

重新核实数据

数据测量错误

重新测量数据

数据随机误差

删除、或者重新观测数据

缺少重要自变量

增加相应自变量

缺少观测数据

增加观测数据

存在异方差

消除异方差,如加权回归等

模型选择错误

更改模型,如改成非线性回归

异常值的常见情况:

因变量 y 出现异常值:一般认为残差超过 image.png 即为异常值。

标注化残差:image.png

删除残差:image.png

学生化残差:image.png,其中image.png 为杠杆值,为帽子矩阵 image.png 的主对角线元素

删除学生化残差:image.png,P 为自变量个数,image.png的观测值被认为是异常值

自变量 X 出现异常值

image.png 为杠杆值,表示自变量第i次观测值与自变量平均值之间的距离,杠杆值 image.png 大的样本点为强影响电。刚感知的平均值 image.pngimage.png 大于2倍或3倍的平均值 image.png 时,被认为是大的

库克距离:image.png反应了 image.png 与残差的综合效应,当 image.png 不是异常值,当 image.png 是异常值

image.png

相关文章
|
9月前
|
算法 安全 机器人
算法提高:计算几何基础 | 判断包含关系
计算几何是计算机科学的一个重要分支,主要研究几何形体的数学描述和计算机描述,在现代工程和数学领域,以及计算机辅助设计、地理信息系统、图形学、机器人技术、超大规模集成电路设计和统计等诸多领域都有重要的用途。在 ACM 竞赛中,出题相对独立,曾出现过与图论、动态规划相结合的题,大多数计算几何问题用程序实现都比较复杂。常用算法包括经典的凸包求解、离散化及扫描线算法、旋转卡壳、半平面交等。本文介绍计算几何常用算法——包含关系。
107 0
|
10月前
|
安全 搜索推荐
如何避免写重复代码?两种常见的方法:抽象和组合
如何避免写重复代码?两种常见的方法:抽象和组合
156 0
|
编解码
失真的概念和定义
失真的概念和定义
137 0
|
机器学习/深度学习 算法 开发者
违背基本假设5| 学习笔记
快速学习违背基本假设5。
68 0
违背基本假设5| 学习笔记
|
机器学习/深度学习 算法 开发者
违背基本假设-1| 学习笔记
快速学习违背基本假设-1。
131 0
违背基本假设-1| 学习笔记
|
机器学习/深度学习 算法 开发者
违背基本假设-2| 学习笔记
快速学习违背基本假设-2。
85 0
违背基本假设-2| 学习笔记
|
机器学习/深度学习 算法 开发者
违背基本假设-4| 学习笔记
快速学习违背基本假设-4。
209 0
违背基本假设-4| 学习笔记
|
机器学习/深度学习 供应链 算法
违背基本假设-3| 学习笔记
快速学习违背基本假设-3。
86 0
违背基本假设-3| 学习笔记
|
SQL 缓存 安全
如何避免写重复代码:善用抽象和组合
通过抽象和组合,我们可以编写出更加简洁、易于理解和稳定的代码;类似于金字塔的建筑过程,我们总是可以在一层抽象之上再叠加一层,从而达到自己的目标。但是在日常的开发工作中,我们如何进行实践呢?本文将以笔者在Akka项目中的一段社区贡献作为引子分享笔者的一点心得。
141 0
如何避免写重复代码:善用抽象和组合
|
设计模式 数据安全/隐私保护
# 设计原则与思想 --- 重复代码or依赖反转原则(DRY)
# 设计原则与思想 --- 重复代码or依赖反转原则(DRY)