八、过拟合问题

简介: 八、过拟合问题

1、过拟合-overfitting定义



如果我们设置过多的特征,通过机器学习获得的假设函数将会和实验数据高度重合(成本函数的值将会十分接近于0),但是这样会使得获得的模型不能较好地预测新的样本数据值,这种问题叫做过拟合问题。通俗地说,就是学习出来的模型不具有良好的“推广”性(generalize),实用性很差。


15aa02361b3142fd8a46a9c4234a5e6c.png

095cb28205544184a7bcb4733e1b3782.png



2、怎样处理过拟合问题


方法一:


减少特征数量,可以通过手动选择保留哪些特征,或者通过“模型选择”算法来实现特征筛选。

方法二:


归一化-Regularization,这种方法不需要减少特征数量,但是需要减少特征项的大小;归一化对于特征值很多时会取得较好的效果,尤其是各个特征对于结果值都有所贡献的时候。



3、归一化



为了应对过拟合问题,可以通过增加特征项在成本函数中的成本值来克服过拟合问题。例如,假如我们想使得下面的函数更加偏向二次函数:

θ0+θ1x+θ2x2+θ3x3+θ4x4


我们想要减少三次方项 θ3x3和四次方项  θ4x4的影响,同时不将这两项从假设函数中删除,我们可以在成本函数中针对三次方项 θ3x3和四次方项 θ4x4增加两项惩罚项:


image.png


在成本函数中增加了两项罚项之后,为了使得最终成本函数最小化,最终参数 θ3和 θ 4 θ4的值必定比较小,从而减小了高次方项的影响,可以缓解过拟合问题。


上述方式的问题在于,给予哪些特征项参数惩罚很难确定,因为很难判断哪些特征项之间有较强的相关性,同时惩罚项的系数确定也是一个问题,系数的选择既不能太大也不能太小。所以有下述通用归一化成本函数:


image.png


其中, λ是归一化参数,当λ取值过大时,会造成欠拟合问题,如除了参数 θ0之外,其他参数均取值为0;若  λ取值过小,则不能起到消除过拟合的作用,还是可能出现过拟合问题。



3.1 线性回归归一化


对归一化之后的成本函数使用梯度下降法的流程如下所示:

b14b21b132b04a1a8a94a40f5f1ea4c4.png

将归一化项提出来之后可以变为以下的形式:


57f316b4e95c4b2f84b8632a9f9414ec.png

其中, 1−αmλ项小于1,所以相对于不归一化处理的梯度下降更新式来说,只是将 θ项进行了缩小处理。


使用了归一化的正规方程的形式如下所示:


905e5cc80c674d86b143b0dd2c406aa8.png



使用归一化还可以解决矩阵  XTX不可逆的问题,可以证明在 λ大于0的情况下, XTX+λ⋅L是可逆的。




3.2 逻辑回归归一化


对归一化之后的成本函数使用梯度下降法的流程如下所示:


33dee6dc676443eab9a8706e819775fe.png


成本函数的表示形式如下所示:

f9a6fcd214d3448ab1a273bd793b9165.png


相对于原本的逻辑回归成本函数,上述成本函数多出了最后的归一化项。






相关文章
|
7月前
|
机器学习/深度学习 算法
大模型开发:什么是过拟合和欠拟合?你如何防止它们?
机器学习中,过拟合和欠拟合影响模型泛化能力。过拟合是模型对训练数据过度学习,测试集表现差,可通过正则化、降低模型复杂度或增加训练数据来缓解。欠拟合则是模型未能捕捉数据趋势,解决方案包括增加模型复杂度、添加特征或调整参数。平衡两者需通过实验、交叉验证和超参数调优。
793 0
|
7月前
|
机器学习/深度学习 PyTorch 算法框架/工具
训练误差与泛化误差的说明
训练误差与泛化误差的说明
192 0
|
机器学习/深度学习 算法
机器学习算法之欠拟合和过拟合
机器学习算法之欠拟合和过拟合
|
4月前
|
机器学习/深度学习
|
5月前
|
机器学习/深度学习
过拟合
【7月更文挑战第25天】过拟合。
120 2
|
5月前
|
人工智能 Python
模型评估与选择:避免过拟合与欠拟合
【7月更文第18天】在人工智能的探险旅程中,打造一个既聪明又可靠的模型可不简单。就好比在茫茫人海中找寻那位“知心朋友”,我们需要确保这位“朋友”不仅能在训练时表现优异,还要能在新面孔面前一样游刃有余。这就引出了模型评估与选择的关键议题——如何避免过拟合和欠拟合,确保模型既不过于复杂也不过于简单。今天,我们就来一场轻松的“模型相亲会”,通过交叉验证、混淆矩阵、ROC曲线这些实用工具,帮你的模型找到最佳伴侣。
243 2
|
7月前
|
机器学习/深度学习
欠拟合与过拟合
欠拟合与过拟合
86 0
三、欠拟合和过拟合
三、欠拟合和过拟合
|
机器学习/深度学习 人工智能 测试技术
用 Dropout 正则化对抗 过拟合
用 Dropout 正则化对抗 过拟合
106 0