YOLOv8改进 | 主干篇 | 利用MobileNetV2替换Backbone（轻量化网络结构）-阿里云开发者社区

YOLOv8改进 | 主干篇 | 利用MobileNetV2替换Backbone（轻量化网络结构）

2024-02-07 472 发布于海南

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： YOLOv8改进 | 主干篇 | 利用MobileNetV2替换Backbone（轻量化网络结构）

一、本文介绍

本文给大家带来的改进机制是MobileNetV2，其是专为移动和嵌入式视觉应用设计的轻量化网络结构。其在MobilNetV1的基础上采用反转残差结构和线性瓶颈层。这种结构通过轻量级的深度卷积和线性卷积过滤特征，同时去除狭窄层中的非线性，以维持表征能力。MobileNetV2在性能上和精度上都要比V1版本强很多，其在多种应用（如对象检测、细粒度分类、面部属性识别和大规模地理定位）中都展现了一定的有效性。

适用检测目标：轻量化网络结构适合非常轻量化的读者，同时具有涨点效果

专栏回顾：YOLOv8改进系列专栏——本专栏持续复习各种顶会内容——科研必备

二、MobileNetV2的框架原理

2.1 MobileNetV2的基本原理

MobileNetV2是在MobileNetV1基础上提出来的，其不光具有V1的全部改进，还提出了采用反转残差结构和线性瓶颈层。这种结构通过轻量级的深度卷积和线性卷积过滤特征，同时去除狭窄层中的非线性，以维持表征能力。MobileNetV2通过这种设计提高了性能，并在多种任务和基准测试上表现出色。此外，它提出了一种新的框架SSDLite，用于移动设备上的目标检测，并展示了如何构建移动语义分割模型Mobile DeepLabv3。这种方法允许输入/输出域与变换的表达力解耦，为进一步分析提供了方便的框架。

MobileNetV2的主要创新点包括：

1. 反转残差结构：使用轻量级的深度卷积作为扩展层来提高特征过滤的效率。

2. 线性瓶颈层：在狭窄的层中去除非线性激活函数，以保持网络的表征能力。

3. SSDLite框架：用于移动设备上的高效目标检测，它是一种简化和优化的SSD框架。

2.1.1 反转残差结构

反转残差结构是MobileNetV2的关键特性，它采用轻量级的深度可分离卷积作为扩展层。这种结构首先使用1x1的卷积将输入特征图的通道数扩大，然后应用深度可分离卷积对这些扩展的特征图进行空间特征提取，最后再次通过1x1的卷积将通道数减少，恢复到原来的尺寸。这样的设计有效地提高了网络处理特征的效率，同时减少了参数数量和计算成本。通过这种方式，MobileNetV2能够在保持模型轻量的同时，提供足够的模型表现力，适用于移动和嵌入式设备上的高效计算。

上图展示了残差块和反转残差块之间的区别：

(a) 残差：传统的残差块通过直接连接输入和输出来促进特征的传递，通常包含具有高通道数的层和ReLU激活函数。

(b) 反转残差块：在反转残差块中，连接是在瓶颈层之间，即通道数较少的层，而且去除了非线性激活函数，以保持特征的表达力。这种设计通常首先用一个扩展层增加通道数，然后应用深度卷积处理特征，并且在最后一个线性层减少通道数。

2.1.2 线性瓶颈层

线性瓶颈层是MobileNetV2架构中的另一个关键特性。在这种结构中，传统的非线性激活函数被有意地从瓶颈层中去除。瓶颈层是指那些通道数较少的卷积层，它们位于扩展层和压缩层之间。这样做的目的是为了减少信息在通过狭窄层时的损失，因为非线性操作可能会破坏特征中的一些信息。通过保持这些层的线性，网络能够维持更丰富的特征表示，这对于提高模型的整体性能至关重要。

总结：就是在一些卷积层里面把激活函数删除掉了，类似于v8中的Bottleneck模块，将其中的激活函数删除掉。

2.1.3 SSDLite框架

SSDLite是一个轻量级的目标检测框架，专为移动设备优化。它是SSD框架的简化版本，通过使用深度可分离卷积替换SSD中的标准卷积，显著减少了计算量和模型的大小。SSDLite继承了SSD的单次检测机制，使得模型在进行目标检测时既高效又准确。这种设计使SSDLite非常适合在资源受限的设备上进行实时目标检测任务。

上图展示了可分离卷积块的演变。其中：

(a) 展示了常规的卷积。

(b) 展示了可分离卷积块，这种块首先使用深度卷积分别处理每个输入通道，然后用一个1x1的卷积组合这些特征。

(d) 展示了带有扩展层的瓶颈结构，它使用一个扩展层放大特征空间，然后再用深度卷积和1x1卷积进行处理。

对角线阴影的纹理表示不包含非线性的层，最后的浅色层表示下一个块的开始。请注意，当堆叠时，2d和2c是等效的块。

YOLOv8改进 | 主干篇 | 利用MobileNetV2替换Backbone（轻量化网络结构）

一、本文介绍

二、MobileNetV2的框架原理