违背基本假设-2| 学习笔记

简介: 快速学习违背基本假设-2。

开发者学堂课程【机器学习算法 :违背基本假设-2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7205


违背基本假设-2

 

内容介绍

一、 异方差检验:制图分析

二、 消除异方差

 

一、 异方差检验:制图分析

数据x、y,使用一元线性回归模型拟合:y-11.266+3.992*x,判断是否存在异方差。这是一个常见的问题,比如给一个数据,直接用一元线性回归拟合,把它当作一个结论得到结果,这还是有风险的。之前说过用线性回归模型去完成,有一些一系列的前置条件要满足的但不知道是否满足。这里讲的方差就要判断是否存在异方差。由散点图看出,还是有 x 随 y 的变化有明显的趋势。在从残差分析图中也可以看到一定的趋势,这就认为可能存在异方差的问题。

图片19.png

接下来做一个等级相关系数法:

第一步,做y关于x的普通最小二乘回归,求出image.png的估计值image.png

第二步,求等级差image.png,把image.pngimage.png按升序排列,ximage.png和|image.png|分别有一先求出image.png再计算image.png,求等级相关系数 rs 其中样本个数n=20

第三步,做 rs 的显著性检验,n>8时,进行 t 检验。计算 t 统计量:

image.png 原假设为image.png,拒绝原假设,即存在异方差问题

image.png

 

二、 消除异方差

消除异方差:加权最小二乘法

消除异方差办法有多种,常见的有加权最小二乘法、BOX-COX 变换法、方差稳定性变换法等以一元线性回归最小二乘法估计参数为例,其离差平方和公式:下图中可见。

存在的问题:每个观测值(即每个样本)的权重相同(都为1),同方差时,每个观测值在离差平方和中的地位是一样的,但是当异方差时,方差大的观测值,对平方和的影响也大,OLE 求得的回归线,会被拉向方差大的样本点,导致方差小的样本拟合效果差。

此时考虑调整权重,以平衡各个观察值的作用,即为加权最小二乘法,其离差平方和公式变为:公式如下:

image.png

尝试不同的 m 值,得到不同的权重,取结果最好的一组。权重值估算公式为:

以 m=2 为例,得到权重值 ω=1/xi2,即(0.08650519,0.30864198.0.04725898,0.02872738)

计算加权均值ω=1.638, ω=18.234

计算回归参数: 公式如图

等级相关系数法或残差分析图法去评估有没有改进。

image.png

相关文章
|
9月前
|
算法 安全 机器人
算法提高:计算几何基础 | 判断包含关系
计算几何是计算机科学的一个重要分支,主要研究几何形体的数学描述和计算机描述,在现代工程和数学领域,以及计算机辅助设计、地理信息系统、图形学、机器人技术、超大规模集成电路设计和统计等诸多领域都有重要的用途。在 ACM 竞赛中,出题相对独立,曾出现过与图论、动态规划相结合的题,大多数计算几何问题用程序实现都比较复杂。常用算法包括经典的凸包求解、离散化及扫描线算法、旋转卡壳、半平面交等。本文介绍计算几何常用算法——包含关系。
107 0
|
10月前
|
安全 搜索推荐
如何避免写重复代码?两种常见的方法:抽象和组合
如何避免写重复代码?两种常见的方法:抽象和组合
156 0
|
编解码
失真的概念和定义
失真的概念和定义
137 0
|
机器学习/深度学习 算法 开发者
违背基本假设6| 学习笔记
快速学习违背基本假设6。
71 0
违背基本假设6| 学习笔记
|
机器学习/深度学习 算法 开发者
违背基本假设5| 学习笔记
快速学习违背基本假设5。
68 0
违背基本假设5| 学习笔记
|
机器学习/深度学习 供应链 算法
违背基本假设-3| 学习笔记
快速学习违背基本假设-3。
86 0
违背基本假设-3| 学习笔记
|
机器学习/深度学习 算法 开发者
违背基本假设-4| 学习笔记
快速学习违背基本假设-4。
209 0
违背基本假设-4| 学习笔记
|
机器学习/深度学习 算法 开发者
违背基本假设-1| 学习笔记
快速学习违背基本假设-1。
131 0
违背基本假设-1| 学习笔记
|
SQL 缓存 安全
如何避免写重复代码:善用抽象和组合
通过抽象和组合,我们可以编写出更加简洁、易于理解和稳定的代码;类似于金字塔的建筑过程,我们总是可以在一层抽象之上再叠加一层,从而达到自己的目标。但是在日常的开发工作中,我们如何进行实践呢?本文将以笔者在Akka项目中的一段社区贡献作为引子分享笔者的一点心得。
141 0
如何避免写重复代码:善用抽象和组合
|
设计模式 数据安全/隐私保护
# 设计原则与思想 --- 重复代码or依赖反转原则(DRY)
# 设计原则与思想 --- 重复代码or依赖反转原则(DRY)