深度学习复习总览(四)

简介: 深度学习复习总览(四)

深度模型优化与正则化:

  1. 网络优化
    目的:经验风险最小化。对于低维来说,目的是逃离局部最优点;对于高维来说,则是逃离鞍点。
  2. 梯度下降
    批量梯度下降、小批量梯度下降、随机批量梯度下降。


87.png

3.学习率

88.png


流程:学习率预热、学习率衰减、学习率周期调整、自适应学习率。

1)学习率预热:

89.png


2)学习率衰减

90.png91.png


3)周期性学习率调整

92.png

93.png


4)自适应学习率

94.png95.png

4.缓解batch小导致的幅度震荡

动量法

96.png97.png


比较:

98.png


5.参数初始化

权重初始化不能全为0,而偏置可以全为0。

99.png

目的:合适的初始化方法,解决梯度消失(初始化太小)和梯度爆炸(初始化太大)等问题。

初始化方法:

100.png

1)基于固定方差的参数初始化


高斯分布初始化:从一个固定均值和方差的高斯分布进行随机初始化。

均匀分布初始化:在一个[-r,r]的区间内采用均匀分布来初始化。

这两种一般比较常见。

2)基于方差缩放的参数初始化

本质:尽可能保持每个神经元的输入和输出的方差一致,根据神经元的连接数量来自适应的调整初始化分布的方差。

主要包括Xavier初始化和He初始化。主要对比如下,分别在不同的激活函数下设置不同的方差来保证前后的方差不变。


101.png


推导过程:

①Xavier推导:

102.png

②He推导:

103.png


3)正交初始化方法

104.png

数据初始化

主要包括三种,步骤分为两步,区别见下面:

105.png

106.png

用途总结:

107.png


逐层归一化

目的:解决内部协变量偏移问题;解决梯度消失、梯度爆炸等问题;更平滑的优化地形。

1)批量归一化(BN)

是对一个中间层的单个神经元进行归一化操作。其主要在一篇论文中提出,InceptionV2。

108.png2)层归一化

109.png


比较:

110.png

超参数优化

详情就不再说了,调参是一门技术,有需要的同学自己去搜索吧,。。

111.png


过拟合-正则化

过拟合:即模型的训练参数可能太大,导致模型的训练效果太好了,而正则化就是降低这种效果。

112.png

1)l1和l2正则化

113.png



2)提前停止

114.png


3)dropout

115.png


116.png



10.数据增强

117.png


目录
相关文章
|
机器学习/深度学习
深度学习复习总览(五)
深度学习复习总览(五)
154 0
|
机器学习/深度学习
深度学习复习总览(三)
深度学习复习总览(三)
286 0
|
机器学习/深度学习 PyTorch 算法框架/工具
深度学习复习总览(二)
深度学习复习总览(二)
125 0
|
机器学习/深度学习 人工智能 算法
深度学习复习总览(一)
深度学习复习总览(一)
379 0
|
机器学习/深度学习 运维 安全
深度学习在安全事件检测中的应用:守护数字世界的利器
深度学习在安全事件检测中的应用:守护数字世界的利器
562 22
|
机器学习/深度学习 编解码 人工智能
计算机视觉五大技术——深度学习在图像处理中的应用
深度学习利用多层神经网络实现人工智能,计算机视觉是其重要应用之一。图像分类通过卷积神经网络(CNN)判断图片类别,如“猫”或“狗”。目标检测不仅识别物体,还确定其位置,R-CNN系列模型逐步优化检测速度与精度。语义分割对图像每个像素分类,FCN开创像素级分类范式,DeepLab等进一步提升细节表现。实例分割结合目标检测与语义分割,Mask R-CNN实现精准实例区分。关键点检测用于人体姿态估计、人脸特征识别等,OpenPose和HRNet等技术推动该领域发展。这些方法在效率与准确性上不断进步,广泛应用于实际场景。
1487 64
计算机视觉五大技术——深度学习在图像处理中的应用
|
机器学习/深度学习 传感器 数据采集
深度学习在故障检测中的应用:从理论到实践
深度学习在故障检测中的应用:从理论到实践
1333 6
|
机器学习/深度学习 人工智能 运维
深度学习在流量监控中的革命性应用
深度学习在流量监控中的革命性应用
503 40
|
机器学习/深度学习 数据采集 存储
深度学习在DOM解析中的应用:自动识别页面关键内容区块
本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈,采用代理复用、批量推理、多线程并发及模型量化等策略,将单页耗时从5秒优化至2秒,提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取,确保高效稳定运行,为大规模数据采集提供参考。
412 0
|
机器学习/深度学习 运维 资源调度
深度学习在资源利用率优化中的应用:让服务器更聪明
深度学习在资源利用率优化中的应用:让服务器更聪明
674 6