常见的机器学习模型正则化的方式

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 常见的机器学习模型正则化的方式

请列举常见的机器学习模型正则化的方式,简述自己对不同方法的理解。


答:


第一类:引入参数范数惩罚项

通过在损失函数中添加一个参数范数惩罚,限制模型的学习能力。其中,常见的有:L1正则化与L2正则化。

这种正则化方式可以从解空间形状、函数叠加和引入贝叶斯先验(L1正则化引入拉普拉斯先验、L2正则化引入高斯先验)等多个角度来解读。其中,我认为最直观的是花书中从解空间形状角度的分析:

如图3-1所示(图源《深度学习》花书),为在二维时的体现。其中,黄色的部分是L2 和L1正则顶约束后的解空间,绿色的等高线是凸优化问题中目标函数的等高线。

图3-1 二维情况下的解空间与L1、L2正则化


由图可见,LI 正则项约束的解空间是多边形,更容易在尖角处与等高线碰撞出稀疏解;而L2 正则项约束后的解空间是圆形,更容易在权值小的地方产生解。


第二类:数据增强

让机器学习模型泛化效果更好的最简单粗暴的方法是使用更多的数据集训练,但是我们往往无法获得更多的真实数据,这就需要我们“生成”更多的数据。在视觉任务中,常见操作有:对图片进行小幅旋转,平移,放大,缩小和给图片噪声等变换,甚至可以利用GAN来生成更多图像。


第三类:模型集成

通过训练多个不同的模型,并让所有模型一起表决测试集的输出,比如Bagging等方法。

同时,尽管人们对Dropout的作用有多种角度的解释,但我个人倾向于将Dropout也理解为一种模型集成的方法,我认为它提供了一种低端的Bagging方法的近似,尽管训练中各模型(即每次Dropout后留下的网络)间并不独立,而是共享参数的。


第四类:其它方法

一些其它方法或者trick还有很多,比如:

Earlystopping:当验证集上的误差在事先指定的循环次数内没有进一步改善时就停止算法。

标签平滑:通过在均匀分布和hard标签之间应用加权平均值来生成soft标签。

对抗训练(Adversarial Training):过程中,样本会被混合一些微小的扰动(改变很小,但是很可能造成误分类),然后使神经网络适应这种改变,从而增加模型的鲁棒性。

目录
相关文章
|
27天前
|
机器人
1024 云上见 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建 “文旅领域知识问答机器人” 领精美计时器
1024 云上见 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建 “文旅领域知识问答机器人” 领精美计时器
81 3
|
6天前
|
机器学习/深度学习 数据采集 监控
如何使用机器学习模型来自动化评估数据质量?
如何使用机器学习模型来自动化评估数据质量?
|
2天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
11 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
6天前
|
机器学习/深度学习 算法 PyTorch
用Python实现简单机器学习模型:以鸢尾花数据集为例
用Python实现简单机器学习模型:以鸢尾花数据集为例
21 1
|
16天前
|
机器学习/深度学习 数据采集 Python
从零到一:手把手教你完成机器学习项目,从数据预处理到模型部署全攻略
【10月更文挑战第25天】本文通过一个预测房价的案例,详细介绍了从数据预处理到模型部署的完整机器学习项目流程。涵盖数据清洗、特征选择与工程、模型训练与调优、以及使用Flask进行模型部署的步骤,帮助读者掌握机器学习的最佳实践。
52 1
|
19天前
|
机器学习/深度学习 数据采集 监控
如何使用机器学习模型来自动化评估数据质量?
如何使用机器学习模型来自动化评估数据质量?
|
24天前
|
机器人
1024 云上见 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建 “文旅领域知识问答机器人” 领 200个 精美计时器等你领
1024 云上见 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建 “文旅领域知识问答机器人” 领 200个 精美计时器等你领
68 2
|
30天前
|
人工智能 算法 测试技术
PAI 大语言模型评测平台现已支持裁判员模型评测
本文将为您介绍如何在 PAI 大语言模型评测平台,基于裁判员模型,评价开源模型或者微调后模型的性能。该功能限时免费,欢迎使用。
|
30天前
|
机器学习/深度学习 数据挖掘 Serverless
手把手教你全面评估机器学习模型性能:从选择正确评价指标到使用Python与Scikit-learn进行实战演练的详细指南
【10月更文挑战第10天】评估机器学习模型性能是开发流程的关键,涉及准确性、可解释性、运行速度等多方面考量。不同任务(如分类、回归)采用不同评价指标,如准确率、F1分数、MSE等。示例代码展示了使用Scikit-learn库评估逻辑回归模型的过程,包括数据准备、模型训练、性能评估及交叉验证。
58 1
|
12天前
|
机器学习/深度学习 算法
探索机器学习模型的可解释性
【10月更文挑战第29天】在机器学习领域,一个关键议题是模型的可解释性。本文将通过简单易懂的语言和实例,探讨如何理解和评估机器学习模型的决策过程。我们将从基础概念入手,逐步深入到更复杂的技术手段,旨在为非专业人士提供一扇洞悉机器学习黑箱的窗口。

相关产品

  • 人工智能平台 PAI