机器学习中的数学原理——最小二乘法

简介: 机器学习中的数学原理——最小二乘法

一、什么是最小二乘法

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差(真实目标对象与拟合目标对象的差)的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。

二、实战案例

下图是商家广告费点击量之间散点图,假设存在这样一个前提:投入 的广告费越多,广告的点击量就越高,进而带来访问数的增加,但是他们之间并不是简单的线性关系。

现在问当广告费为200时,它的点击量是多少呢?我们可以先估计一下,取它前后的两个点,估计点击量时在400-600之间。再画图预测一下:

从这个图里面我们可以进一步猜测,大概是在500次左右。高中物理课堂上我们学过拟合函数,即根据给的x-y点,拟合出函数的表达式,为了研究的方便,这里我们就用最简单的一次函数来拟合吧:

通过我们的直觉判断,我们大致可以拟合成这样:

现在我们的目标只要求出θ0和θ1就可以啦!那这个θ0和θ1怎么求呢?我们可以假设θ0=1,θ1=2,那么这个表达式就变成:

这样的话,我们就可以将真实值与我们通过上面的y=1+2x计算出来的值相对比啦!

首先给出最小二乘法误差计算公式:

为了避免引起误解我先 说明一下:x(i) 和 y(i) 中的 i 不是 i 次幂的意思,而是指第 i 个训练数据。前面加上二分之一是为了微分计算方便,可以不加理会,记住这个公式就可以。所有我们上面的误差就可以计算了:

我们可以看到误差达到了112176.5,是一个很大数字,所以我们要做的事就是改变参数θ的值,使得误差E(θ)尽可能小,即修改参数 θ,使这个值变得越来越小。

就是的做法称为最小二乘法!是不是很简单,没有想象中的那么难。

三、总结

上述例子中,我们用一次函数拟合曲线,通过选择不同的参数θ使得误差E(θ)越来越小,则我们称拟合的效果也越来越好。这是比较理想的状态,一次函数是很简单的一种函数表达式,如果我们想要E(θ)更小,拟合效果更好,那么我们需要考虑更加复杂的函数表达式,这就是我们后面所要学习的神经网络——它可以拟合任何曲线!当然这是后话,我们的学习还在进行中!


相关文章
|
28天前
|
机器学习/深度学习 存储 运维
分布式机器学习系统:设计原理、优化策略与实践经验
本文详细探讨了分布式机器学习系统的发展现状与挑战,重点分析了数据并行、模型并行等核心训练范式,以及参数服务器、优化器等关键组件的设计与实现。文章还深入讨论了混合精度训练、梯度累积、ZeRO优化器等高级特性,旨在提供一套全面的技术解决方案,以应对超大规模模型训练中的计算、存储及通信挑战。
64 4
|
2月前
|
机器学习/深度学习 自然语言处理 语音技术
探索机器学习中的深度学习模型:原理与应用
探索机器学习中的深度学习模型:原理与应用
46 0
|
3月前
|
机器学习/深度学习 算法 知识图谱
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
|
3月前
|
机器学习/深度学习 算法
机器学习入门(三):K近邻算法原理 | KNN算法原理
机器学习入门(三):K近邻算法原理 | KNN算法原理
|
3月前
|
机器学习/深度学习 API
机器学习入门(七):线性回归原理,损失函数和正规方程
机器学习入门(七):线性回归原理,损失函数和正规方程
|
3月前
|
机器学习/深度学习 程序员
【机器学习】朴素贝叶斯原理------迅速了解常见概率的计算
【机器学习】朴素贝叶斯原理------迅速了解常见概率的计算
|
3月前
|
机器学习/深度学习 算法
【机器学习】逻辑回归介绍(逻辑回归应用场景,原理,损失及优化详解!!!)
【机器学习】逻辑回归介绍(逻辑回归应用场景,原理,损失及优化详解!!!)
|
5月前
|
机器学习/深度学习 算法 搜索推荐
【机器学习】机器学习的基本概念、算法的工作原理、实际应用案例
机器学习是人工智能的一个分支,它使计算机能够在没有明确编程的情况下从数据中学习并改进其性能。机器学习的目标是让计算机自动学习模式和规律,从而能够对未知数据做出预测或决策。
154 2
|
4月前
|
机器学习/深度学习 人工智能 算法
探索人工智能:机器学习的基本原理与Python代码实践
【9月更文挑战第6天】本文深入探讨了人工智能领域中的机器学习技术,旨在通过简明的语言和实际的编码示例,为初学者提供一条清晰的学习路径。文章不仅阐述了机器学习的基本概念、主要算法及其应用场景,还通过Python语言展示了如何实现一个简单的线性回归模型。此外,本文还讨论了机器学习面临的挑战和未来发展趋势,以期激发读者对这一前沿技术的兴趣和思考。
|
5月前
|
机器学习/深度学习 数据采集 物联网
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
175 0