RT-DETR改进策略【模型轻量化】| 替换骨干网络为EfficientNet v1 高效的移动倒置瓶颈结构

简介: RT-DETR改进策略【模型轻量化】| 替换骨干网络为EfficientNet v1 高效的移动倒置瓶颈结构

一、本文介绍

本文记录的是基于EfficientNet v1的 RT-DETR轻量化改进方法研究EfficientNet采用了创新性的复合缩放方法,通过精心平衡网络宽度深度分辨率来提升性能。本文将EfficientNet的设计优势融入RT-DETR中,提升RT-DETR的性能与效率,使其在目标检测任务中表现更为出色。

本文配置了原模型中的efficientnet-b0efficientnet-b1efficientnet-b2efficientnet-b3efficientnet-b4efficientnet-b5efficientnet-b6efficientnet-b7efficientnet-b8efficientnet-l210种不同大小的模型结构,以满足不同的需求。

模型 参数量 计算量 推理速度
rtdetr-l 32.8M 108.0GFLOPs 11.6ms
Improved 23.7M 60.8GFLOPs -

专栏目录:RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:RT-DETR改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

二、EfficientNet详解

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

2.1 轻量设计出发点

  • 随着卷积神经网络的发展,模型规模不断扩大,但硬件内存限制使得在追求更高精度的同时需要更好的效率。

  • 传统的卷积神经网络如AlexNetGoogleNetSENet等虽然精度不断提高,但参数过多,面临硬件瓶颈。

  • 同时,在移动设备普及的背景下,也需要设计高效的小型网络,如SqueezeNetsMobileNets等,但对于大型模型的高效设计空间和调优成本问题仍未得到很好解决

因此,EfficientNet旨在研究超大型且能超越现有精度的卷积神经网络的模型效率,通过模型缩放来实现这一目标。

2.2 结构原理

2.2.1 复合缩放方法

提出一种新的复合缩放方法,使用复合系数$\phi$统一缩放网络的宽度、深度和分辨率。具体公式为$$depth: d=\alpha^{\phi}$$$$width: w=\beta^{\phi}$$$$resolution: r=\gamma^{\phi}$$其中$\alpha$、$\beta$、$\gamma$是通过小网格搜索确定的常数,且满足$\alpha \cdot \beta^{2} \cdot \gamma^{2} \approx 2$,$\alpha \geq 1$,$\beta \geq 1$,$\gamma \geq 1$。

这种方法基于观察到网络宽度深度分辨率之间存在相互关联,平衡这三个维度的缩放对于提高模型性能至关重要,而传统的单一维度缩放方法存在局限性。

例如,仅增加网络深度会遇到梯度消失问题,且精度提升会逐渐减小;仅增加宽度或分辨率也会出现精度饱和的情况。通过这种复合缩放方法,可以根据可用资源的增加,按照一定比例同时调整网络的各个维度,从而在保持效率的同时提高模型精度。

在这里插入图片描述

2.2.2 EfficientNet - B0基线网络

通过多目标神经架构搜索开发了新的移动尺寸基线网络EfficientNet - B0

其主要构建模块是移动倒置瓶颈MBConv,并添加了挤压与激励优化。网络结构在不同阶段具有不同的层数、输入分辨率和输出通道数,如起始阶段是一个$Conv3x3$层,输入分辨率为$224x224$,输出通道为$32$,后续阶段包括不同类型的MBConv层卷积层等,从EfficientNet - B0开始,通过上述复合缩放方法,固定$\phi$进行小网格搜索确定$\alpha$、$\beta$、$\gamma$,然后再固定这些系数,通过改变$\phi$来缩放基线网络,得到EfficientNet - B1B7等一系列模型。

2.3 优势

  • 精度方面:在ImageNet数据集上,EfficientNet - B7达到了84.3%的top - 1精度,超越了之前的最佳模型GPipe,同时使用的参数比GPipe少8.4倍。与广泛使用的ResNet - 50相比,EfficientNet - B4在相似的FLOPS下,将top - 1精度从76.3%提高到83.0%(提升了6.7%)。
  • 效率方面:在推理速度上,EfficientNet - B1比ResNet - 152快5.7倍,EfficientNet - B7比GPipe快6.1倍。在计算资源使用上,一般比其他具有相似精度的卷积神经网络减少一个数量级的参数和FLOPS,如EfficientNet - B3使用的FLOPS比ResNeXt - 101少18倍,但精度更高。

论文:https://arxiv.org/pdf/1905.11946
源码:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet

三、实现代码及RT-DETR修改步骤

模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址:

https://blog.csdn.net/qq_42591591/article/details/145252934

相关文章
|
7月前
|
C++
基于Reactor模型的高性能网络库之地址篇
这段代码定义了一个 InetAddress 类,是 C++ 网络编程中用于封装 IPv4 地址和端口的常见做法。该类的主要作用是方便地表示和操作一个网络地址(IP + 端口)
348 58
|
7月前
|
网络协议 算法 Java
基于Reactor模型的高性能网络库之Tcpserver组件-上层调度器
TcpServer 是一个用于管理 TCP 连接的类,包含成员变量如事件循环(EventLoop)、连接池(ConnectionMap)和回调函数等。其主要功能包括监听新连接、设置线程池、启动服务器及处理连接事件。通过 Acceptor 接收新连接,并使用轮询算法将连接分配给子事件循环(subloop)进行读写操作。调用链从 start() 开始,经由线程池启动和 Acceptor 监听,最终由 TcpConnection 管理具体连接的事件处理。
258 2
|
7月前
基于Reactor模型的高性能网络库之Tcpconnection组件
TcpConnection 由 subLoop 管理 connfd,负责处理具体连接。它封装了连接套接字,通过 Channel 监听可读、可写、关闭、错误等
206 1
|
7月前
|
JSON 监控 网络协议
干货分享“对接的 API 总是不稳定,网络分层模型” 看电商 API 故障的本质
本文从 OSI 七层网络模型出发,深入剖析电商 API 不稳定的根本原因,涵盖物理层到应用层的典型故障与解决方案,结合阿里、京东等大厂架构,详解如何构建高稳定性的电商 API 通信体系。
|
9月前
|
域名解析 网络协议 安全
计算机网络TCP/IP四层模型
本文介绍了TCP/IP模型的四层结构及其与OSI模型的对比。网络接口层负责物理网络接口,处理MAC地址和帧传输;网络层管理IP地址和路由选择,确保数据包准确送达;传输层提供端到端通信,支持可靠(TCP)或不可靠(UDP)传输;应用层直接面向用户,提供如HTTP、FTP等服务。此外,还详细描述了数据封装与解封装过程,以及两模型在层次划分上的差异。
2043 13
|
9月前
|
网络协议 中间件 网络安全
计算机网络OSI七层模型
OSI模型分为七层,各层功能明确:物理层传输比特流,数据链路层负责帧传输,网络层处理数据包路由,传输层确保端到端可靠传输,会话层管理会话,表示层负责数据格式转换与加密,应用层提供网络服务。数据在传输中经过封装与解封装过程。OSI模型优点包括标准化、模块化和互操作性,但也存在复杂性高、效率较低及实用性不足的问题,在实际中TCP/IP模型更常用。
1205 10
|
4月前
|
机器学习/深度学习 数据采集 人工智能
深度学习实战指南:从神经网络基础到模型优化的完整攻略
🌟 蒋星熠Jaxonic,AI探索者。深耕深度学习,从神经网络到Transformer,用代码践行智能革命。分享实战经验,助你构建CV、NLP模型,共赴二进制星辰大海。
|
5月前
|
机器学习/深度学习 传感器 算法
【无人车路径跟踪】基于神经网络的数据驱动迭代学习控制(ILC)算法,用于具有未知模型和重复任务的非线性单输入单输出(SISO)离散时间系统的无人车的路径跟踪(Matlab代码实现)
【无人车路径跟踪】基于神经网络的数据驱动迭代学习控制(ILC)算法,用于具有未知模型和重复任务的非线性单输入单输出(SISO)离散时间系统的无人车的路径跟踪(Matlab代码实现)
379 2
|
编解码 异构计算
RT-DETR改进策略【Neck】| BiFPN:双向特征金字塔网络-跨尺度连接和加权特征融合
RT-DETR改进策略【Neck】| BiFPN:双向特征金字塔网络-跨尺度连接和加权特征融合
902 10
RT-DETR改进策略【Neck】| BiFPN:双向特征金字塔网络-跨尺度连接和加权特征融合
|
5月前
|
机器学习/深度学习 并行计算 算法
【CPOBP-NSWOA】基于豪冠猪优化BP神经网络模型的多目标鲸鱼寻优算法研究(Matlab代码实现)
【CPOBP-NSWOA】基于豪冠猪优化BP神经网络模型的多目标鲸鱼寻优算法研究(Matlab代码实现)
140 8