【机器学习】过拟合和欠拟合怎么判断，如何解决？(面试回答)-阿里云开发者社区

【机器学习】过拟合和欠拟合怎么判断，如何解决？(面试回答)

2024-08-06 2410

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文介绍了如何通过观察训练误差和验证误差来判断模型是否出现过拟合或欠拟合，并提供了相应的解决方案，包括增加数据、调整模型复杂度、使用正则化技术等。

过拟合和欠拟合怎么判断，如何解决？

（1）判断：训练集误差和验证集误差，从而判断算法达到什么效果

（2）过拟合的解决方法

数据集角度
- 增加样本量
- 数据集扩增
- 原有数据加随机噪声
- 重采样
特征角度
- 特征选择
- 特征降维
模型角度
- 降低模型复杂度
- 正则化，正则化正是通过在损失函数上添加额外的参数稀疏性惩罚项（正则项），来限制网络的稀疏性，以此约束网络的实际容量，从而防止模型出现过拟合。L1正则化是将权值的绝对值之和加入损失函数，使得权值中0值比重增大，因此得到的权值较为稀疏。L2正则化是将权重的平方之和加入损失函数，使得权值分布更加平均，所以权值较为平滑。
- Dropout舍弃，在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃，使得每次训练的网络结构多样。
训练角度
- 早停止，如在训练中多次迭代后发现模型性能没有显著提高就停止训练
- 交叉验证

（3）欠拟合的解决方法