RT-DETR改进策略【注意力机制篇】| 2024 PPA 并行补丁感知注意模块,提高小目标关注度

简介: RT-DETR改进策略【注意力机制篇】| 2024 PPA 并行补丁感知注意模块,提高小目标关注度

一、本文介绍

本文记录的是利用PPA (并行补丁感知注意模块)改进RT-DETR检测精度,详细说明了优化原因,注意事项等。原论文在红外小目标检测任务中,小目标在多次下采样操作中容易丢失关键信息。PPA模块==通过替代编码器和解码器基本组件中的传统卷积操作,更好地保留小目标的重要信息。==


专栏目录:RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:RT-DETR改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

二、PPA 介绍

HCF-Net: Hierarchical Context Fusion Network for Infrared Small Object Detection

2.1 原理

2.1.1 多分支特征提取原理

采用多分支特征提取策略,通过不同分支提取不同尺度和层次的特征。利用局部、全局和串行卷积分支,对输入特征张量进行处理。通过控制 patch size参数实现局部和全局分支的区分,计算非重叠 patch之间的注意力矩阵,实现局部和全局特征提取与交互。在特征提取过程中,还通过一系列操作对特征进行选择和调整权重,最终将三个分支的结果求和得到融合后的特征。

2.1.2 特征融合和注意力原理

在多分支特征提取后,利用注意力机制进行自适应特征增强。注意力模块包括高效的通道注意力和空间注意力组件。首先通过一维通道注意力图和二维空间注意力图对特征进行依次处理,然后经过一系列激活函数、批归一化和 dropout等操作,得到最终输出。

2.2 结构

2.2.1 多分支特征提取结构

  • 主要由多分支融合和注意力机制两部分组成。多分支融合部分包括 patch - aware和串联卷积。patch - aware中的参数p设置为2和4,分别代表局部和全局分支。对于输入特征张量F,先通过点式卷积调整得到F',然后通过三个分支分别计算F_localF_globalF_conv,最后将这三个结果求和得到\tilde{F}

2.2.2 特征融合和注意力结构

  • 包括通道注意力和空间注意力组件。\tilde{F}依次经过一维通道注意力图M_c和二维空间注意力图M_s的处理,通过元素级乘法和后续的激活函数、批归一化等操作,最终得到PPA的输出F''

在这里插入图片描述

  1. 优势
    • 多分支特征提取优势:通过多分支策略能够捕获对象的多尺度特征,提高了小目标检测的准确性。不同分支可以关注到不同尺度和层次的信息,避免了单一尺度下可能丢失的小目标特征。
    • 特征融合和注意力优势:利用注意力机制可以自适应地增强特征,突出小目标的关键信息。通道注意力和空间注意力的结合能够更好地选择和聚焦于与小目标相关的特征,提高网络对小目标的表征能力。

论文:https://arxiv.org/pdf/2403.10778
源码:https://github.com/zhengshuchen/HCFNet

三、实现代码及RT-DETR修改步骤

模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址:

https://blog.csdn.net/qq_42591591/article/details/144141100

目录
相关文章
|
8月前
|
机器学习/深度学习 数据可视化 算法
YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
1385 6
YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
|
8月前
|
机器学习/深度学习 计算机视觉
RT-DETR改进策略【注意力机制篇】| 2024 蒙特卡罗注意力(MCAttn)模块,提高小目标的关注度
RT-DETR改进策略【注意力机制篇】| 2024 蒙特卡罗注意力(MCAttn)模块,提高小目标的关注度
242 1
RT-DETR改进策略【注意力机制篇】| 2024 蒙特卡罗注意力(MCAttn)模块,提高小目标的关注度
|
8月前
|
机器学习/深度学习 编解码 TensorFlow
RT-DETR改进策略【模型轻量化】| 替换骨干网络为EfficientNet v1 高效的移动倒置瓶颈结构
RT-DETR改进策略【模型轻量化】| 替换骨干网络为EfficientNet v1 高效的移动倒置瓶颈结构
410 0
RT-DETR改进策略【模型轻量化】| 替换骨干网络为EfficientNet v1 高效的移动倒置瓶颈结构
|
8月前
|
机器学习/深度学习 计算机视觉
RT-DETR改进策略【损失函数篇】| WIoU v3:针对低质量样本的边界框回归损失函数
RT-DETR改进策略【损失函数篇】| WIoU v3:针对低质量样本的边界框回归损失函数
316 14
|
8月前
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【注意力机制篇】| CVPR2024 CAA上下文锚点注意力机制
YOLOv11改进策略【注意力机制篇】| CVPR2024 CAA上下文锚点注意力机制
932 1
YOLOv11改进策略【注意力机制篇】| CVPR2024 CAA上下文锚点注意力机制
|
8月前
|
计算机视觉
RT-DETR改进策略【卷积层】| ICCV-2023 引入Dynamic Snake Convolution动态蛇形卷积,改进ResNetLayer
RT-DETR改进策略【卷积层】| ICCV-2023 引入Dynamic Snake Convolution动态蛇形卷积,改进ResNetLayer
200 15
RT-DETR改进策略【卷积层】| ICCV-2023 引入Dynamic Snake Convolution动态蛇形卷积,改进ResNetLayer
|
8月前
|
计算机视觉
YOLOv11改进策略【SPPF】| AIFI : 基于Transformer的尺度内特征交互,在降低计算成本的同时提高模型的性能
YOLOv11改进策略【SPPF】| AIFI : 基于Transformer的尺度内特征交互,在降低计算成本的同时提高模型的性能
312 9
YOLOv11改进策略【SPPF】| AIFI : 基于Transformer的尺度内特征交互,在降低计算成本的同时提高模型的性能
|
8月前
|
机器学习/深度学习 计算机视觉
RT-DETR改进策略【注意力机制篇】| CVPR2024 CAA上下文锚点注意力机制
RT-DETR改进策略【注意力机制篇】| CVPR2024 CAA上下文锚点注意力机制
245 1
RT-DETR改进策略【注意力机制篇】| CVPR2024 CAA上下文锚点注意力机制
|
8月前
|
人工智能
RT-DETR改进策略【损失函数篇】| 2024 引进Focaler-IoU损失函数 加强边界框回归 (Focaler-DIoU、Focaler-GIoU、Focaler-CIoU)
RT-DETR改进策略【损失函数篇】| 2024 引进Focaler-IoU损失函数 加强边界框回归 (Focaler-DIoU、Focaler-GIoU、Focaler-CIoU)
202 1
|
8月前
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【注意力机制篇】| 2024 PPA 并行补丁感知注意模块,提高小目标关注度
YOLOv11改进策略【注意力机制篇】| 2024 PPA 并行补丁感知注意模块,提高小目标关注度
268 11
YOLOv11改进策略【注意力机制篇】| 2024 PPA 并行补丁感知注意模块,提高小目标关注度