RT-DETR改进策略【卷积层】| CVPR-2023 部分卷积 PConv 轻量化卷积,降低内存占用

简介: RT-DETR改进策略【卷积层】| CVPR-2023 部分卷积 PConv 轻量化卷积,降低内存占用

一、本文介绍

本文记录的是利用部分卷积 Partial Conv优化RT-DETR的目标检测方法研究深度可分离卷积可以减少FLOPs,但会导致更高的内存访问,引起延迟并减慢整体计算。==部分卷积利用逐点卷积处理通道冗余,减少模型计算量和内存访问量。==


专栏目录:RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:RT-DETR改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

二、部分卷积原理介绍

Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks

2.1 出发点

  • 解决FLOPS问题:在追求快速神经网络的过程中,许多工作致力于减少浮点运算(FLOPs),但研究者发现FLOPs的减少并不一定能带来延迟的同等降低,主要原因是每秒浮点运算次数(FLOPS)过低。通过对典型神经网络在Intel CPU上FLOPS的比较,发现很多现有神经网络FLOPS较低,其FLOPS普遍低于流行的ResNet50,导致“快速”神经网络实际上不够快,FLOPs的减少无法转化为延迟的准确降低。
  • 深度可分离卷积的内存访问问题:深度可分离卷积(DWConv)是一种常用的减少FLOPs的方法,但它在实际应用中存在问题。当为了补偿精度下降而增加网络宽度(即DWConv的通道数c增加到c')时,会导致更高的内存访问,从而引起不可忽视的延迟并减慢整体计算,特别是对于I/O受限的设备。

2.2 原理

  • 利用特征图冗余:观察到特征图在不同通道之间存在高度相似性(冗余),通过部分卷积(PConv)来利用这种冗余。PConv不是对所有输入通道进行常规卷积,而是仅对一部分输入通道应用常规卷积进行空间特征提取,同时保持其余通道不变。
  • 减少计算冗余和内存访问:通过这种方式,同时减少了计算冗余和内存访问。从计算量(FLOPs)来看,PConv的FLOPs仅为常规卷积的一部分(例如,当典型的部分比例$r = \frac{c_{p}}{c}=\frac{1}{4}$时,PConv的FLOPs仅为常规Conv的$\frac{1}{16}$);从内存访问量来看,PConv的内存访问量也仅为常规卷积的一部分(同样在$r=\frac{1}{4}$时,仅为常规Conv的$\frac{1}{4}$)。

2.3 结构

  • 基本结构:对于输入$I\in\mathbb{R}^{c×h×w}$,PConv选取连续的$c_{p}$个通道(例如可以是第一个或最后一个连续的通道作为代表)应用常规卷积,输出的特征图维度与输入特征图维度相同(即输出$O\in\mathbb{R}^{c×h×w}$)。
  • 与PWConv结合:为了充分利用所有通道的信息,在PConv之后紧接着添加一个逐点卷积(PWConv)。它们在输入特征图上的有效感受野看起来像一个T形卷积,这种T形卷积更关注中心位置,与均匀处理一个区域的常规卷积不同。并且将T形卷积分解为PConvPWConv可以进一步利用滤波器间的冗余,节省FLOPs。

在这里插入图片描述

2.4 优势

  • 有效提取空间特征:实验证明PConv在提取空间特征方面是有效的。通过构建由PConvPWConv组成的简单网络,并在从预训练ResNet50提取的特征图数据集上进行训练,结果表明PConv + PWConv能达到最低的测试损失,更好地近似常规卷积进行特征变换,说明仅从部分特征图中捕获空间特征是足够且高效的。
  • 适用于构建快速神经网络PConv为设计快速有效的神经网络提供了一种新的选择,具有很大潜力替代现有的DWConv等操作,并且基于PConv构建的FasterNet在各种设备上实现了快速运行,在分类、检测和分割任务上取得了良好的性能,验证了PConv的有效性。

论文:https://arxiv.org/pdf/2303.03667
源码:https://github.com/JierunChen/FasterNet

三、实现代码及RT-DETR修改步骤

模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址:

https://blog.csdn.net/qq_42591591/article/details/143817740

目录
相关文章
|
6月前
|
存储 分布式计算 监控
阿里云服务器实例经济型e、通用算力型u1、计算型c8i、通用型g8i、内存型r8i详解与选择策略
在阿里云现在的活动中,可选的云服务器实例规格主要有经济型e、通用算力型u1、计算型c8i、通用型g8i、内存型r8i实例,虽然阿里云在活动中提供了多种不同规格的云服务器实例,以满足不同用户和应用场景的需求。但是有的用户并不清楚他们的性能如何,应该如何选择。本文将详细介绍阿里云服务器中的经济型e、通用算力型u1、计算型c8i、通用型g8i、内存型r8i实例的性能、适用场景及选择参考,帮助用户根据自身需求做出更加精准的选择。
|
2月前
|
存储 人工智能 自然语言处理
AI代理内存消耗过大?9种优化策略对比分析
在AI代理系统中,多代理协作虽能提升整体准确性,但真正决定性能的关键因素之一是**内存管理**。随着对话深度和长度的增加,内存消耗呈指数级增长,主要源于历史上下文、工具调用记录、数据库查询结果等组件的持续积累。本文深入探讨了从基础到高级的九种内存优化技术,涵盖顺序存储、滑动窗口、摘要型内存、基于检索的系统、内存增强变换器、分层优化、图形化记忆网络、压缩整合策略以及类操作系统内存管理。通过统一框架下的代码实现与性能评估,分析了每种技术的适用场景与局限性,为构建高效、可扩展的AI代理系统提供了系统性的优化路径和技术参考。
154 4
AI代理内存消耗过大?9种优化策略对比分析
|
1月前
|
机器学习/深度学习 监控 安全
解密虚拟化弹性内存:五大核心技术与实施策略
本文深入解析虚拟化环境中实现内存弹性管理的五大核心技术与实施策略。内容涵盖内存架构演进、关键技术原理、性能优化方法及典型问题解决方案,助力提升虚拟机密度与资源利用率。
107 0
|
1月前
|
边缘计算 算法 Java
Java 绿色计算与性能优化:从内存管理到能耗降低的全方位优化策略与实践技巧
本文探讨了Java绿色计算与性能优化的技术方案和应用实例。文章从JVM调优(包括垃圾回收器选择、内存管理和并发优化)、代码优化(数据结构选择、对象创建和I/O操作优化)等方面提出优化策略,并结合电商平台、社交平台和智能工厂的实际案例,展示了通过Java新特性提升性能、降低能耗的显著效果。最终指出,综合运用这些优化方法不仅能提高系统性能,还能实现绿色计算目标,为企业节省成本并符合环保要求。
80 0
|
弹性计算 安全 数据库
【转】云服务器虚拟化内存优化指南:提升性能的7个关键策略
作为云计算服务核心组件,虚拟化内存管理直接影响业务系统性能表现。本文详解了内存优化方案与技术实践,助您降低30%资源浪费。
82 0
【转】云服务器虚拟化内存优化指南:提升性能的7个关键策略
|
6月前
|
缓存 监控 算法
JVM简介—2.垃圾回收器和内存分配策略
本文介绍了Java垃圾回收机制的多个方面,包括垃圾回收概述、对象存活判断、引用类型介绍、垃圾收集算法、垃圾收集器设计、具体垃圾回收器详情、Stop The World现象、内存分配与回收策略、新生代配置演示、内存泄漏和溢出问题以及JDK提供的相关工具。
JVM简介—2.垃圾回收器和内存分配策略
|
6月前
|
机器学习/深度学习 存储 PyTorch
PyTorch内存优化的10种策略总结:在有限资源环境下高效训练模型
在大规模深度学习模型训练中,GPU内存容量常成为瓶颈,特别是在训练大型语言模型和视觉Transformer时。本文系统介绍了多种内存优化策略,包括混合精度训练、低精度训练(如BF16)、梯度检查点、梯度累积、张量分片与分布式训练、
245 14
PyTorch内存优化的10种策略总结:在有限资源环境下高效训练模型
|
7月前
|
机器学习/深度学习 编解码 BI
YOLOv11改进策略【Conv和Transformer】| CVPR-2023 BiFormer 稀疏自注意力,减少内存占用
YOLOv11改进策略【Conv和Transformer】| CVPR-2023 BiFormer 稀疏自注意力,减少内存占用
285 3
YOLOv11改进策略【Conv和Transformer】| CVPR-2023 BiFormer 稀疏自注意力,减少内存占用
|
7月前
|
机器学习/深度学习 编解码 BI
RT-DETR改进策略【Conv和Transformer】| CVPR-2023 BiFormer 稀疏自注意力,减少内存占用
RT-DETR改进策略【Conv和Transformer】| CVPR-2023 BiFormer 稀疏自注意力,减少内存占用
215 0
RT-DETR改进策略【Conv和Transformer】| CVPR-2023 BiFormer 稀疏自注意力,减少内存占用
|
7月前
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【卷积层】| CVPR-2023 部分卷积 PConv 轻量化卷积,降低内存占用
YOLOv11改进策略【卷积层】| CVPR-2023 部分卷积 PConv 轻量化卷积,降低内存占用
688 0
YOLOv11改进策略【卷积层】| CVPR-2023 部分卷积 PConv 轻量化卷积,降低内存占用

热门文章

最新文章