深度学习复习总览(四)

简介: 深度学习复习总览(四)

深度模型优化与正则化:

  1. 网络优化
    目的:经验风险最小化。对于低维来说,目的是逃离局部最优点;对于高维来说,则是逃离鞍点。
  2. 梯度下降
    批量梯度下降、小批量梯度下降、随机批量梯度下降。


87.png

3.学习率

88.png


流程:学习率预热、学习率衰减、学习率周期调整、自适应学习率。

1)学习率预热:

89.png


2)学习率衰减

90.png91.png


3)周期性学习率调整

92.png

93.png


4)自适应学习率

94.png95.png

4.缓解batch小导致的幅度震荡

动量法

96.png97.png


比较:

98.png


5.参数初始化

权重初始化不能全为0,而偏置可以全为0。

99.png

目的:合适的初始化方法,解决梯度消失(初始化太小)和梯度爆炸(初始化太大)等问题。

初始化方法:

100.png

1)基于固定方差的参数初始化


高斯分布初始化:从一个固定均值和方差的高斯分布进行随机初始化。

均匀分布初始化:在一个[-r,r]的区间内采用均匀分布来初始化。

这两种一般比较常见。

2)基于方差缩放的参数初始化

本质:尽可能保持每个神经元的输入和输出的方差一致,根据神经元的连接数量来自适应的调整初始化分布的方差。

主要包括Xavier初始化和He初始化。主要对比如下,分别在不同的激活函数下设置不同的方差来保证前后的方差不变。


101.png


推导过程:

①Xavier推导:

102.png

②He推导:

103.png


3)正交初始化方法

104.png

数据初始化

主要包括三种,步骤分为两步,区别见下面:

105.png

106.png

用途总结:

107.png


逐层归一化

目的:解决内部协变量偏移问题;解决梯度消失、梯度爆炸等问题;更平滑的优化地形。

1)批量归一化(BN)

是对一个中间层的单个神经元进行归一化操作。其主要在一篇论文中提出,InceptionV2。

108.png2)层归一化

109.png


比较:

110.png

超参数优化

详情就不再说了,调参是一门技术,有需要的同学自己去搜索吧,。。

111.png


过拟合-正则化

过拟合:即模型的训练参数可能太大,导致模型的训练效果太好了,而正则化就是降低这种效果。

112.png

1)l1和l2正则化

113.png



2)提前停止

114.png


3)dropout

115.png


116.png



10.数据增强

117.png


目录
相关文章
|
12月前
|
机器学习/深度学习
深度学习复习总览(五)
深度学习复习总览(五)
38 0
|
12月前
|
机器学习/深度学习
深度学习复习总览(三)
深度学习复习总览(三)
62 0
|
12月前
|
机器学习/深度学习 PyTorch 算法框架/工具
深度学习复习总览(二)
深度学习复习总览(二)
47 0
|
12月前
|
机器学习/深度学习 人工智能 算法
深度学习复习总览(一)
深度学习复习总览(一)
76 0
|
2天前
|
机器学习/深度学习 监控 自动驾驶
深度学习在图像识别中的应用进展
【5月更文挑战第30天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉领域前进的核心动力。尤其在图像识别任务中,深度学习模型展现出了卓越的性能,不仅大幅提高了识别精度,还拓展了应用场景的广度。本文旨在探讨近年来深度学习技术在图像识别领域的创新应用,分析其技术演进脉络,并对未来发展趋势进行展望。通过综述卷积神经网络(CNN)的优化策略、数据增强技巧以及迁移学习的实践案例,揭示深度学习如何有效解决图像识别中的挑战问题,并对几个关键领域如自动驾驶、医疗影像分析和安防监控中的实际应用进行深入剖析。
|
2天前
|
机器学习/深度学习 边缘计算 算法
深度学习在图像识别中的应用与挑战
【5月更文挑战第30天】 随着人工智能技术的飞速发展,深度学习已经成为计算机视觉领域的核心动力。特别是在图像识别任务中,深度神经网络凭借其卓越的特征提取和学习能力,不断刷新着准确率的上限。然而,尽管取得了显著成就,图像识别系统仍面临着多方面的挑战,包括但不限于数据集偏差、模型泛化能力、对抗性攻击以及计算资源的密集需求。本文将深入探讨深度学习在图像识别领域的应用现状,分析其面临的主要技术难题,并对未来发展趋势进行展望。
|
2天前
|
机器学习/深度学习 人工智能 监控
深度学习在图像识别中的应用与挑战
【5月更文挑战第30天】 本文深入剖析了深度学习技术在图像识别领域的应用,并探讨了其面临的主要挑战。通过对现有文献的综述和案例分析,本研究揭示了卷积神经网络(CNN)等深度学习模型如何革新了图像处理流程,并展示了其在多个领域,包括医疗诊断、自动驾驶以及安全监控中的实际应用。同时,文章也对数据偏见、模型泛化能力不足、对抗性攻击等问题进行了批判性分析,并提出了可能的解决方案。
|
2天前
|
机器学习/深度学习 人工智能 算法
深度学习在图像识别中的应用与挑战
【5月更文挑战第30天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉领域进步的关键力量。尤其在图像识别任务中,深度神经网络展现了超越传统算法的卓越性能。本文将探讨深度学习技术在图像识别领域的应用实例,并剖析其面临的主要挑战,如数据偏差、模型泛化能力以及计算资源要求等。
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习在图像识别中的应用与挑战
【5月更文挑战第30天】 随着人工智能技术的飞速发展,深度学习作为其重要分支之一,已经在众多领域展现出了巨大的潜力。尤其是在图像识别任务中,深度学习模型已经取得了令人瞩目的成果。本文将探讨深度学习在图像识别领域的应用,分析其面临的挑战,并对未来发展趋势进行展望。
|
2天前
|
机器学习/深度学习 自动驾驶 算法
深度学习在图像识别中的应用与挑战
【5月更文挑战第30天】 随着人工智能技术的迅速发展,深度学习已成为推动计算机视觉领域进步的关键技术之一。特别是在图像识别任务中,深度学习模型如卷积神经网络(CNN)已经取得了显著的成果。本文将探讨深度学习在图像识别领域的应用现状、面临的挑战以及未来的发展方向。通过分析现有文献和最新研究成果,我们旨在为读者提供一个关于该技术如何影响图像处理和解析的深入视角,并讨论实现更高效、准确识别系统的潜在途径。