机器学习笔记2-单变量线性回归

简介: 机器学习笔记2-单变量线性回归

1.模型描述:

1.1监督学习 Supervised Learning:

given the right answer for each example in the data.
对于每个数据集中的样例都有一个人为给出的正确答案。

1.2回归问题 Regression problem:

predict real-valued output.
预测实际值的输出。
ps:回归问题这个从字面意思上我老是会记错它是干嘛的,可以这样联想记忆,函数是一个线性模型,就是一条线,我们要让新的值,回归到这条线上面。就是预测一个新的值是
否在这个模型上,就是预测值是否会回归到这条线上,这样可能就记住了回归是预测实际值的输出。

1.3分类问题 Classification problem:

predict discrete-valued output.
预测离散值的输出。

1.4训练过程:


根据训练集学习出一个学习算法,也就是一个函数,然后通过输入新数据来预测新的值。
只有一个变量的线性回归叫做单变量线性回归。

2.代价函数:

We can measure the accuracy of our hypothesis function by using a
cost function . This takes
an average difference (actually a fancier version of an average) of all the results of the
hypothesis with inputs from x's and the actual output y's.
我们可以使用代价函数来衡量假设函数的准确性。这将假设的所有结果与x的输入和实际输出y的平均值进行平均差(实际上是平均值的简化形式)。

ps:1.对于单变量的线性回归来说,h(x)= Θ0 + Θ1*x,两个变量可以根据训练集的数据得出很多组值,但是只有一组值是最好的。所以要怎么衡量哪一组Θ是最好的,就需要使用代价函数,
代价函数的公式和方差标准差有点像。使用x1计算出来的h(x1)和训练集的y1的差值的平方,这里是计算当前h(x)和实际的差距,然后在除以2m(m是样本的数据),将数据平均化。
2.代价函数因为是平方的1/2m,所以永远是一个正数

如果将代价函数的所有可能的取值画出来,单变量线性回归的情况下会是一个碗的形状,那么碗的底部的中心就是全局的最优解,就是最小的那个代价函数。

3.梯度下降:

先看下梯度下降的定义:

梯度下降是一种算法, 用来找到代价函数的最小值。
1.任意从一点的Θ0,Θ1开始
2.让$(Θ0,Θ1)$慢慢减小,直到找到最小值的代价函数。
ps:

1.形象的例子就是想象代价函数就是一座山,站在山的某一点去往山下,做法就是先往山上看一圈,往山下的方向走一小步,走完一步,再下一步用相同的方式再走下一步。
2.从代价函数的值始终是正数我们知道,然后α是小于等于1,

是学习率α乘以J(θ0,θ1)对θ1的偏导数,当斜率是正数的时候,θ0或者θ1就会往左边下降,当斜率是负数的时候,θ0或者θ1就会往右边下降。这样就保证了不管斜率是正向还是负向都是
往局部最低点去靠近。

3.对于θ0,θ1是要同时更新的,可以看图片中正确和错误的做法。如果是后者其实是拿了已经变更的θ0在去更新θ1,这个时候值就不是同步更新的,最后得到的就可能不是最小值。
4.从不同的初始值,就是任意一点的(θ0,θ1)开始,可能会去往不同的局部最小值。

5.如果步长太小,会导致梯度下降比较慢,要计算很多次才能找到最小值(但是这个影响其实比较小)。如果步长较大,可能会出现收敛失败或者甚至是发散的结果。

6.如果初始点就是在局部的最优解上面,所以偏导数会是0,所以按照公式计算θ1 = θ1 - 0。值就是原来的值所以不会继续往下下降。

4.线性回归的梯度下降:

将上文学习到的代价函数和梯度下降进行公式合并,就可以推导出来一个新的公式。

所以线性回归的梯度下降公式就是:

5.总结:

1.学习了监督学习,回归问题,分类问题的一些作用和定义;
2.学习了代价函数和梯度下降算法,并将两者的公式组合在一起生成了一个新的线性回归的提低下降的算法公式;
3.复习了以前学习的一些数学知识,偏导数,斜率的含义等,特别是在推导公式的时候。

相关文章
|
6月前
|
机器学习/深度学习 算法 TensorFlow
机器学习算法简介:从线性回归到深度学习
【5月更文挑战第30天】本文概述了6种基本机器学习算法:线性回归、逻辑回归、决策树、支持向量机、随机森林和深度学习。通过Python示例代码展示了如何使用Scikit-learn、statsmodels、TensorFlow库进行实现。这些算法在不同场景下各有优势,如线性回归处理连续值,逻辑回归用于二分类,决策树适用于规则提取,支持向量机最大化类别间隔,随机森林集成多个决策树提升性能,而深度学习利用神经网络解决复杂模式识别问题。理解并选择合适算法对提升模型效果至关重要。
249 4
|
1月前
|
机器学习/深度学习 计算机视觉 Python
模型预测笔记(三):通过交叉验证网格搜索机器学习的最优参数
本文介绍了网格搜索(Grid Search)在机器学习中用于优化模型超参数的方法,包括定义超参数范围、创建参数网格、选择评估指标、构建模型和交叉验证策略、执行网格搜索、选择最佳超参数组合,并使用这些参数重新训练模型。文中还讨论了GridSearchCV的参数和不同机器学习问题适用的评分指标。最后提供了使用决策树分类器进行网格搜索的Python代码示例。
69 1
|
25天前
|
机器学习/深度学习 数据采集 算法
探索机器学习中的线性回归
【10月更文挑战第25天】本文将深入浅出地介绍线性回归模型,一个在机器学习领域中广泛使用的预测工具。我们将从理论出发,逐步引入代码示例,展示如何利用Python和scikit-learn库实现一个简单的线性回归模型。文章不仅适合初学者理解线性回归的基础概念,同时也为有一定基础的读者提供实践指导。
|
1月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
探索机器学习:从线性回归到深度学习
在这篇文章中,我们将一起踏上一场激动人心的旅程,穿越机器学习的广阔天地。我们将从最基本的线性回归开始,逐步深入到复杂的深度学习模型。无论你是初学者还是有经验的开发者,这篇文章都将为你提供新的视角和深入的理解。让我们一起探索这个充满无限可能的世界吧!
|
1月前
|
机器学习/深度学习 API
机器学习入门(七):线性回归原理,损失函数和正规方程
机器学习入门(七):线性回归原理,损失函数和正规方程
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
探索机器学习:从线性回归到深度学习
【9月更文挑战第4天】在这篇文章中,我们将深入探讨机器学习的世界,从基础的线性回归模型开始,逐步深入到复杂的深度学习网络。我们将通过实际的代码示例,揭示这些模型背后的数学原理,以及如何在现实世界的问题中应用它们。无论你是初学者还是有经验的数据科学家,这篇文章都将为你提供新的视角和深入的理解。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
探索机器学习的奥秘:从线性回归到深度学习
【8月更文挑战第26天】本文将带领读者走进机器学习的世界,从基础的线性回归模型开始,逐步深入到复杂的深度学习网络。我们将探讨各种算法的原理、应用场景以及实现方法,并通过代码示例加深理解。无论你是初学者还是有一定经验的开发者,这篇文章都将为你提供有价值的知识和技能。让我们一起揭开机器学习的神秘面纱,探索这个充满无限可能的领域吧!
|
3月前
|
机器学习/深度学习 人工智能 算法
探索机器学习:Python中的线性回归模型实现
【8月更文挑战第24天】在机器学习的世界中,线性回归是最基础也是应用最广泛的算法之一。本文将通过Python编程语言,使用scikit-learn库来实现一个简单的线性回归模型。我们将从理论出发,逐步深入到代码实现,最后通过一个实际数据集来验证模型的效果。无论你是机器学习的初学者,还是想要复习线性回归的基础知识,这篇文章都将为你提供有价值的信息。让我们一起踏上这段探索之旅吧!
|
5月前
|
机器学习/深度学习 算法 BI
机器学习笔记(一) 感知机算法 之 原理篇
机器学习笔记(一) 感知机算法 之 原理篇
|
5月前
|
机器学习/深度学习 数据采集 算法
【机器学习】线性回归:以房价预测为例
【机器学习】线性回归:以房价预测为例
382 1

热门文章

最新文章

下一篇
无影云桌面