深度学习:MobileNet V2

简介: 深度学习:MobileNet V2

MobileNet V2

前言

MobileNet V2 是谷歌团队2018年提出的网络,相比于MobileNet V1。

主要改进

Inverted Residuals Block

Residual Block

在这里插入图片描述
首先我们回顾传统的残差块,它是由一个 1 1的卷积降维+ 3 3 卷积 + 1* 1卷积升维。(激活函数与BN省略)

Expansion Layer

在这里插入图片描述

倒残差结构如上图,他是先用 1 1卷积升维+DW卷积 + 1 1卷积降维。

ReLU6

在这里插入图片描述

作者把ReLU激活函数换成了ReLU6,y的数值不在随着x的增长而增长,到6之后不再变化。

原因:
由于ReLU的值域是0到正无穷,在低精度浮点数下不能很好的表示,于是改成了ReLU6可以增加模型的稳定性。

这里所说的“低精度”,我看到有人说不是指的float16,而是指的定点运算(fixed-point arithmetic)。

Linear Activation Function

作者通过证明,对低维度做ReLU运算,很容易造成信息的丢失。而在高维度进行ReLU运算的话,信息的丢失则会很少。
所以作者把最后1 * 1卷积降维后的激活函数换成线性激活函数。

小结

把上面内容汇聚到一起,于是就有了如下模块:

在这里插入图片描述
这里注意只有stride =1 的时候才有残差模块,因为要保证输入矩阵特征与输出矩阵特征一致才可以执行add操作。

实验

在这里插入图片描述

目录
相关文章
|
3月前
|
机器学习/深度学习 数据可视化 算法框架/工具
深度学习第3天:CNN卷积神经网络
深度学习第3天:CNN卷积神经网络
|
3月前
|
机器学习/深度学习 自然语言处理 搜索推荐
|
3月前
|
机器学习/深度学习
转弯半径-深度学习训练
转弯半径(RADIUS OF TURNING CIRCLE),是指汽车行驶过程中,由转向中心到前外转向轮与地面接触点的距离。当方向盘转到极限位置时,由转向中心到前外转向轮接地中心的距离称为最小转弯半径,它反映了汽车通过最小曲率半径弯曲道路的能力和在狭窄路面上调头行驶的能力。
61 1
|
机器学习/深度学习 人工智能 并行计算
深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍
深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍
深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍
|
11月前
|
机器学习/深度学习 PyTorch TensorFlow
深度学习在图像分类中的应用
随着人工智能技术的不断发展,深度学习作为其中的重要组成部分,已经在许多领域取得了突破性的进展。本文将重点介绍深度学习在图像分类任务中的应用,并通过一个示例来展示其强大的能力。
223 0
|
机器学习/深度学习 数据采集 PyTorch
计算机视觉PyTorch迁移学习 - (一)
计算机视觉PyTorch迁移学习 - (一)
|
机器学习/深度学习 PyTorch 算法框架/工具
计算机视觉PyTorch迁移学习 - (二)
计算机视觉PyTorch迁移学习 - (二)
|
机器学习/深度学习 PyTorch 算法框架/工具
计算机视觉PyTorch实现图像分类(二) - AlexNet
计算机视觉PyTorch实现图像分类(二) - AlexNet
155 0
|
机器学习/深度学习 TensorFlow 算法框架/工具
【深度学习】从LeNet-5识别手写数字入门深度学习
【深度学习】从LeNet-5识别手写数字入门深度学习
140 0
|
数据采集 机器学习/深度学习 PyTorch
深度学习实战(一):LeNet实现CIFAR-10图像分类
利用torchvision.datasets函数可以在线导入pytorch中的数据集,包含一些常见的数据集如MNIST、CIFAR-10等。本次使用的是CIFAR10数据集,也是一个很经典的图像分类数据集,由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集,一共包含 10 个类别的 RGB 彩色图片。
321 0