RT-DETR改进策略【Conv和Transformer】| GRSL-2024最新模块卷积和自注意力融合模块 CAFM 减少图像中的噪声干扰

2025-02-08 555

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： RT-DETR改进策略【Conv和Transformer】| GRSL-2024最新模块卷积和自注意力融合模块 CAFM 减少图像中的噪声干扰

一、本文介绍

本文记录的是利用HCANet模型中提出的CAFM模块优化RT-DETR的目标检测网络模型。CAFM利用卷积操作的局部特征提取能力，并通过自注意力机制补充全局信息，优化了特征提取能力。本文将其加入到RT-DETR中，使模型能够增强复杂图像的适应能力，并在不增加过多计算负担的情况下提高特征提取能力。

专栏目录：RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址：RT-DETR改进专栏——以发表论文的角度，快速准确的找到有效涨点的创新点！

二、卷积和注意力融合模块介绍

Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising

2.1 CAFM模块设计出发点

卷积操作受限于局部性和有限的感受野，在对全局特征建模时存在不足。而Transformer借助注意力机制在提取全局特征和捕捉长程依赖方面表现出色。因此为了对全局和局部特征进行建模，设计了卷积和注意力融合模块（CAFM）。

2.2 CAFM模块原理

2.2.1 局部分支

通过一系列操作增强跨通道交互和促进信息整合。

首先使用$1×1$卷积调整通道维度，接着进行通道混洗操作（将输入张量沿通道维度分组，在每组内采用深度可分离卷积进行通道混洗，然后将各组合并），最后再用$3×3×3$卷积提取特征。

2.2.2 全局分支

首先通过$1×1$卷积和$3×3$深度可分离卷积生成查询（Q）、键（K）和值（V），将Q和K重塑后计算注意力图，通过注意力机制计算输出，再加上原始输入得到全局分支的输出。

在这里插入图片描述

2.3 模块结构

由局部分支和全局分支组成。

局部分支：依次包括$1×1$卷积、通道混洗操作和$3×3×3$卷积。
全局分支：包含生成Q、K、V的卷积操作，以及对Q、K进行重塑和计算注意力图的过程，最后通过$1×1$卷积和注意力机制得到输出并加上原始输入。

2.4 优势

结合了卷积和注意力机制的优点，能够同时对全局和局部特征进行有效建模。
通过合理的结构设计，在不增加过多计算负担的情况下提高了特征提取能力。

论文：https://arxiv.org/pdf/2403.10067
源码：https://github.com/summitgao/HCANet/blob/main/HCANet.py

三、实现代码及RT-DETR修改步骤

模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址：

https://blog.csdn.net/qq_42591591/article/details/144103617

RT-DETR改进策略【Conv和Transformer】| GRSL-2024最新模块卷积和自注意力融合模块 CAFM 减少图像中的噪声干扰

一、本文介绍

二、卷积和注意力融合模块介绍

2.1 CAFM模块设计出发点

2.2 CAFM模块原理

2.2.1 局部分支

2.2.2 全局分支

2.3 模块结构

2.4 优势

三、实现代码及RT-DETR修改步骤

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

RT-DETR改进策略【Conv和Transformer】| GRSL-2024最新模块 卷积和自注意力融合模块 CAFM 减少图像中的噪声干扰

一、本文介绍

二、卷积和注意力融合模块介绍

2.1 CAFM模块设计出发点

2.2 CAFM模块原理

2.2.1 局部分支

2.2.2 全局分支

2.3 模块结构

2.4 优势

三、实现代码及RT-DETR修改步骤

热门文章

最新文章

相关电子书

RT-DETR改进策略【Conv和Transformer】| GRSL-2024最新模块卷积和自注意力融合模块 CAFM 减少图像中的噪声干扰