机器学习:深入理解局部加权线性回归+源码实现

简介: 机器学习:深入理解局部加权线性回归+源码实现

线性回归是在已有数据的基础上,通过建立含有未知参数的线性模型来拟合样本点。通过已有数据确定未知参数后,就可用回归模型来预测其他输入状态下的输出值。


一般地,线性回归分为标准线性回归(Standard LR)和局部加权线性回归(Locally Weighted LR)两种。其区别在于:前者对所有的样本点共享一个权重矩阵,权重矩阵由全局MSE得出;后者每个样本点使用一个权重矩阵,权重矩阵由核函数与MSE共同决定。下面从一个实例考虑二者的区别。


image.png

image.png

考虑如图1(i)所示的数据集,用标准线性回归直观上并不恰当,似乎用曲线可以拟合得更好,这是全局共享权重矩阵的弊端。如图1(ii)所示,将某个样本点 x i x_i x

i


及其邻域内的点视为一个元集合 A A A,对 A A A进行标准线性回归以得到回归直线 ,将样本中的所有元集合对应的回归直线连接起来,就形成了对整个样本集的拟合。换言之,这是用局部最优拟合全局最优,用线性拟合非线性模型。


局部加权线性回归的核心原理在于如何计算出一个元集合并进行标准线性回归。这里引入的是高斯核函数:

k ( x i , x j ) = e − ( x i − x j ) 2 2 σ 2 k(x_i,x_j)=e^{-\frac{(x_i-x_j)^2}{2\sigma^2}}

k(x

i


,x

j


)=e

2

(x

i


−x

j


)

2



这使得离 x i x_i x

i


近的点对 x i x_i x

i


对应元集合的影响大,离 x i x_i x

i


远的点影响小。对每一个点 x i x_i x

i


都运用高斯核函数计算出一个权重矩阵 W i = d i a g ( w 1 , w 2 , . . . , w m ) W_i=diag(w_1,w_2,...,w_m) W

i


=diag(w

1


,w

2


,...,w

m


) ,此时对于每一个样本点都有一个标准线性回归方程,其代价函数为:


image.png

image.png

image.png

于是对于每个预测值而言都有:

image.png

在代码实现层面,下面贴出计算参数的核心代码:

def lwlr_weights(x_Test,xMat,yMat,Gama):       #计算权重矩阵并返回theta
    n = np.shape(xMat)[1]
    weights = np.eye(n)
    temp = np.multiply(np.diagonal((xMat-x_Test).T*(xMat-x_Test)).T,weights)
    weights = np.multiply(np.diagonal(np.exp(-Gama*temp)).T,weights)
    xWx = xMat*weights*xMat.T
    if (np.linalg.det(xWx)==0):
        return "\terror"
    else:
        theta = xWx.I*xMat*weights*yMat.T
        return theta

其中temp与weights的计算通过numpy库中矩阵点乘、提取对角元素等操作避免了显式的for循环。向量化是机器学习中非常重要的节约资源的手段,经验证,本实验200个数据采用矩阵运算只需0.7ms左右完成,而使用for循环则需要3.8ms左右,且此倍率将随着样本扩大而增加。


image.png

如图2所示为回归分析的结果,取Gama=1,900,50000进行实验。Gama越大说明高斯核的作用越强,前述元集合越小,拟合程度越高。但过拟合和欠拟合均不具备机器学习提高泛化能力的初衷,因此在一般模型设计时还会对其正则化。



目录
相关文章
|
6月前
|
机器学习/深度学习 算法 TensorFlow
机器学习算法简介:从线性回归到深度学习
【5月更文挑战第30天】本文概述了6种基本机器学习算法:线性回归、逻辑回归、决策树、支持向量机、随机森林和深度学习。通过Python示例代码展示了如何使用Scikit-learn、statsmodels、TensorFlow库进行实现。这些算法在不同场景下各有优势,如线性回归处理连续值,逻辑回归用于二分类,决策树适用于规则提取,支持向量机最大化类别间隔,随机森林集成多个决策树提升性能,而深度学习利用神经网络解决复杂模式识别问题。理解并选择合适算法对提升模型效果至关重要。
249 4
|
21天前
|
机器学习/深度学习 数据采集 算法
探索机器学习中的线性回归
【10月更文挑战第25天】本文将深入浅出地介绍线性回归模型,一个在机器学习领域中广泛使用的预测工具。我们将从理论出发,逐步引入代码示例,展示如何利用Python和scikit-learn库实现一个简单的线性回归模型。文章不仅适合初学者理解线性回归的基础概念,同时也为有一定基础的读者提供实践指导。
|
1月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
探索机器学习:从线性回归到深度学习
在这篇文章中,我们将一起踏上一场激动人心的旅程,穿越机器学习的广阔天地。我们将从最基本的线性回归开始,逐步深入到复杂的深度学习模型。无论你是初学者还是有经验的开发者,这篇文章都将为你提供新的视角和深入的理解。让我们一起探索这个充满无限可能的世界吧!
|
6月前
|
机器学习/深度学习 数据采集 人工智能
【机器学习】解释什么是线性回归?
【5月更文挑战第15天】【机器学习】解释什么是线性回归?
|
1月前
|
机器学习/深度学习 API
机器学习入门(七):线性回归原理,损失函数和正规方程
机器学习入门(七):线性回归原理,损失函数和正规方程
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
探索机器学习:从线性回归到深度学习
【9月更文挑战第4天】在这篇文章中,我们将深入探讨机器学习的世界,从基础的线性回归模型开始,逐步深入到复杂的深度学习网络。我们将通过实际的代码示例,揭示这些模型背后的数学原理,以及如何在现实世界的问题中应用它们。无论你是初学者还是有经验的数据科学家,这篇文章都将为你提供新的视角和深入的理解。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
探索机器学习的奥秘:从线性回归到深度学习
【8月更文挑战第26天】本文将带领读者走进机器学习的世界,从基础的线性回归模型开始,逐步深入到复杂的深度学习网络。我们将探讨各种算法的原理、应用场景以及实现方法,并通过代码示例加深理解。无论你是初学者还是有一定经验的开发者,这篇文章都将为你提供有价值的知识和技能。让我们一起揭开机器学习的神秘面纱,探索这个充满无限可能的领域吧!
|
3月前
|
机器学习/深度学习 人工智能 算法
探索机器学习:Python中的线性回归模型实现
【8月更文挑战第24天】在机器学习的世界中,线性回归是最基础也是应用最广泛的算法之一。本文将通过Python编程语言,使用scikit-learn库来实现一个简单的线性回归模型。我们将从理论出发,逐步深入到代码实现,最后通过一个实际数据集来验证模型的效果。无论你是机器学习的初学者,还是想要复习线性回归的基础知识,这篇文章都将为你提供有价值的信息。让我们一起踏上这段探索之旅吧!
|
3月前
|
机器学习/深度学习 数据可视化 搜索推荐
【python机器学习】python电商数据K-Means聚类分析可视化(源码+数据集+报告)【独一无二】
【python机器学习】python电商数据K-Means聚类分析可视化(源码+数据集+报告)【独一无二】
146 0

热门文章

最新文章