机器学习中的数学原理——最小二乘法

简介: 机器学习中的数学原理——最小二乘法

一、什么是最小二乘法

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差(真实目标对象与拟合目标对象的差)的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。

二、实战案例

下图是商家广告费点击量之间散点图,假设存在这样一个前提:投入 的广告费越多,广告的点击量就越高,进而带来访问数的增加,但是他们之间并不是简单的线性关系。

现在问当广告费为200时,它的点击量是多少呢?我们可以先估计一下,取它前后的两个点,估计点击量时在400-600之间。再画图预测一下:

从这个图里面我们可以进一步猜测,大概是在500次左右。高中物理课堂上我们学过拟合函数,即根据给的x-y点,拟合出函数的表达式,为了研究的方便,这里我们就用最简单的一次函数来拟合吧:

通过我们的直觉判断,我们大致可以拟合成这样:

现在我们的目标只要求出θ0和θ1就可以啦!那这个θ0和θ1怎么求呢?我们可以假设θ0=1,θ1=2,那么这个表达式就变成:

这样的话,我们就可以将真实值与我们通过上面的y=1+2x计算出来的值相对比啦!

首先给出最小二乘法误差计算公式:

为了避免引起误解我先 说明一下:x(i) 和 y(i) 中的 i 不是 i 次幂的意思,而是指第 i 个训练数据。前面加上二分之一是为了微分计算方便,可以不加理会,记住这个公式就可以。所有我们上面的误差就可以计算了:

我们可以看到误差达到了112176.5,是一个很大数字,所以我们要做的事就是改变参数θ的值,使得误差E(θ)尽可能小,即修改参数 θ,使这个值变得越来越小。

就是的做法称为最小二乘法!是不是很简单,没有想象中的那么难。

三、总结

上述例子中,我们用一次函数拟合曲线,通过选择不同的参数θ使得误差E(θ)越来越小,则我们称拟合的效果也越来越好。这是比较理想的状态,一次函数是很简单的一种函数表达式,如果我们想要E(θ)更小,拟合效果更好,那么我们需要考虑更加复杂的函数表达式,这就是我们后面所要学习的神经网络——它可以拟合任何曲线!当然这是后话,我们的学习还在进行中!


相关文章
|
7月前
|
机器学习/深度学习 算法 Python
机器学习特征筛选:向后淘汰法原理与Python实现
向后淘汰法(Backward Elimination)是机器学习中一种重要的特征选择技术,通过系统性地移除对模型贡献较小的特征,以提高模型性能和可解释性。该方法从完整特征集出发,逐步剔除不重要的特征,最终保留最具影响力的变量子集。其优势包括提升模型简洁性和性能,减少过拟合,降低计算复杂度。然而,该方法在高维特征空间中计算成本较高,且可能陷入局部最优解。适用于线性回归、逻辑回归等统计学习模型。
270 7
|
9月前
|
机器学习/深度学习 资源调度 算法
机器学习领域必知数学符号与概念(一)
本文介绍了一些数学符号以及这些符号的含义。
727 65
|
8月前
|
机器学习/深度学习 数据采集 分布式计算
大数据分析中的机器学习基础:从原理到实践
大数据分析中的机器学习基础:从原理到实践
378 3
|
10月前
|
机器学习/深度学习 存储 运维
分布式机器学习系统:设计原理、优化策略与实践经验
本文详细探讨了分布式机器学习系统的发展现状与挑战,重点分析了数据并行、模型并行等核心训练范式,以及参数服务器、优化器等关键组件的设计与实现。文章还深入讨论了混合精度训练、梯度累积、ZeRO优化器等高级特性,旨在提供一套全面的技术解决方案,以应对超大规模模型训练中的计算、存储及通信挑战。
569 4
|
机器学习/深度学习 算法 知识图谱
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
|
机器学习/深度学习 算法
机器学习入门(三):K近邻算法原理 | KNN算法原理
机器学习入门(三):K近邻算法原理 | KNN算法原理
|
机器学习/深度学习 API
机器学习入门(七):线性回归原理,损失函数和正规方程
机器学习入门(七):线性回归原理,损失函数和正规方程
|
11月前
|
机器学习/深度学习 自然语言处理 语音技术
探索机器学习中的深度学习模型:原理与应用
探索机器学习中的深度学习模型:原理与应用
280 0
|
机器学习/深度学习 程序员
【机器学习】朴素贝叶斯原理------迅速了解常见概率的计算
【机器学习】朴素贝叶斯原理------迅速了解常见概率的计算
|
机器学习/深度学习 算法
【机器学习】逻辑回归介绍(逻辑回归应用场景,原理,损失及优化详解!!!)
【机器学习】逻辑回归介绍(逻辑回归应用场景,原理,损失及优化详解!!!)

热门文章

最新文章

下一篇
oss教程