YOLO创新改进大师_社区达人页_第2页-阿里云开发者社区

YOLO创新改进大师

已加入开发者社区1450天

勋章更多

专家博主

星级博主

技术博主

江湖新秀

成就

已发布269篇文章

24条评论

已回答0个问题

0条评论

已发布0个视频

github地址

我关注的人更多

粉丝更多

技术能力

兴趣领域

擅长领域

技术认证

暂时未有相关云产品技术能力~

YOLO骨灰级玩家

精选

高分内容

最新动态

文章
问答
视频

暂无精选文章

暂无更多信息

2024年07月

07.19 10:05:45

发表了文章 2024-07-19 10:05:45

【YOLOv8改进 - 特征融合NECK】SDI：多层次特征融合模块，替换contact操作

YOLOv8专栏探讨了该目标检测算法的创新改进，包括新机制和实战案例。文章介绍了U-Net v2，一种用于医学图像分割的高效U-Net变体，它通过SDI模块融合语义和细节信息，提升分割准确性。SDI模块结合空间和通道注意力，经通道减缩、尺寸调整和平滑后，用哈达玛积融合特征。提供的核心代码展示了SDI模块的实现。更多详情和论文、代码链接见原文。
07.19 10:04:29

发表了文章 2024-07-19 10:04:29

【YOLOv8改进-SPPF】 AIFI : 基于注意力的尺度内特征交互，保持高准确度的同时减少计算成本

YOLOv8专栏介绍了该系列目标检测框架的最新改进与实战应用。文章提出RT-DETR，首个实时端到端检测器，解决了速度与精度问题。通过高效混合编码器和不确定性最小化查询选择，RT-DETR在COCO数据集上实现高AP并保持高帧率，优于其他YOLO版本。论文和代码已开源。核心代码展示了AIFI Transformer层，用于位置嵌入。更多详情见[YOLOv8专栏](https://blog.csdn.net/shangyanaf/category_12303415.html)。
07.19 10:00:58

发表了文章 2024-07-19 10:00:58

【YOLOv8改进 - 注意力机制】GC Block: 全局上下文块，高效捕获特征图中的全局依赖关系

YOLOv8专栏探讨了目标检测的创新改进，如整合NLNet和SENet优势的GCBlock，用于高效全局上下文建模。GCNet在多个识别任务中表现优越，同时降低了计算成本。文章提供了论文、代码链接及详细实现，包括特征的全局建模、变换和融合步骤。核心GCBlock代码展示了其结构。更多实战案例和配置见相关链接。
07.08 23:22:46

发表了文章 2024-07-08 23:22:46

【YOLOv8改进 - 注意力机制】HCF-Net 之 DASI：维度感知选择性整合模块 | 小目标

YOLO目标检测专栏介绍了HCF-Net，一种针对红外小目标检测的深度学习模型，包含PPA、DASI和MDCR模块。PPA利用多分支注意力捕获多层次特征，DASI实现自适应特征融合，MDCR通过深度可分离卷积细化空间特征。HCF-Net在SIRST数据集上的实验超越其他模型。论文和代码可在提供的链接中找到。DASI模块通过信道分区选择机制动态融合高维和低维特征。YOLOv8引入了DASI结构，结合不同尺度特征以增强小目标检测。更多配置细节参见相关链接。
07.08 23:20:54

发表了文章 2024-07-08 23:20:54

【YOLOv8改进 - 注意力机制】HCF-Net 之 PPA：并行化注意力设计 | 小目标

YOLO目标检测专栏介绍了HCF-Net，一种用于红外小目标检测的深度学习模型，它通过PPA、DASI和MDCR模块提升性能。PPA利用多分支特征提取和注意力机制，DASI实现自适应特征融合，MDCR通过多层深度可分离卷积细化空间特征。HCF-Net在SIRST数据集上表现出色，超越其他方法。论文和代码分别在[arxiv.org](https://arxiv.org/pdf/2403.10778)和[github.com/zhengshuchen/HCFNet](https://github.com/zhengshuchen/HCFNet)上。YOLOv8的PPA类展示了整合注意力机制的结构
07.08 23:17:07

发表了文章 2024-07-08 23:17:07

【YOLOv8改进 - 注意力机制】 MHSA：多头自注意力（Multi-Head Self-Attention）

YOLO目标检测专栏探讨了BoTNet，一种在ResNet瓶颈块中用全局自注意力替换卷积的架构，提升实例分割和检测性能。BoTNet表现优于先前的ResNeSt，且在ImageNet上速度更快。文章介绍了多头自注意力（MHSA）机制，用于学习输入的不同部分间的关系。BoTNet的MHSA层整合在低分辨率特征图中，以捕获长距离依赖。YOLOv8进一步引入MHSA，通过具体的模块定义（如提供的`MHSA`类）来增强模型的注意力机制。相关论文和代码链接可供参考。
07.08 23:15:12

发表了文章 2024-07-08 23:15:12

【YOLOv8改进 - 注意力机制】HCF-Net 之 MDCR：多稀释通道细化器模块，以不同的稀释率捕捉各种感受野大小的空间特征 | 小目标

HCF-Net是针对红外小目标检测的深度学习模型，采用U-Net改进架构，包含PPA、DASI和MDCR模块。PPA利用多分支特征提取增强小目标表示，DASI实现自适应通道融合，MDCR通过多扩张率深度可分离卷积细化空间特征。实验显示，HCF-Net在SIRST数据集上表现出色，超越其他方法。代码和论文可在给出的链接获取。
07.08 23:13:28

发表了文章 2024-07-08 23:13:28

【YOLOv8改进 - 注意力机制】LS-YOLO MSFE：新颖的多尺度特征提取模块 | 小目标/遥感

YOLO系列目标检测模型的新发展，LS-YOLO专为滑坡检测设计。它使用多尺度滑坡数据集（MSLD）和多尺度特征提取（MSFE）模块，结合ECA注意力，提升定位精度。通过改进的解耦头，利用膨胀卷积增强上下文信息。在滑坡检测任务中，LS-YOLO相对于YOLOv5s的AP提高了2.18%，达到97.06%。论文和代码已开源。
07.08 11:20:24

发表了文章 2024-07-08 11:20:24

【YOLOv10改进-注意力机制】HAT(Hybrid Attention Transformer,)混合注意力机制

YOLOv10专栏介绍了一种名为HAT的新方法，旨在改善Transformer在图像超分辨率中的表现。HAT结合通道和窗口注意力，激活更多像素并增强跨窗口信息交互。亮点包括：1) 更多像素激活，2) 有效跨窗口信息聚合，3) 任务特定的预训练策略。HAT模型包含浅层特征提取、深层特征提取和图像重建阶段。提供的代码片段展示了HAT类的定义，参数包括不同层的深度、注意力头数量、窗口大小等。欲了解更多详情和配置，请参考给定链接。
07.08 11:18:39

发表了文章 2024-07-08 11:18:39

【YOLOv10改进-特征融合篇】EVC(Explicit Visual Center): 中心化特征金字塔模块 | 小目标

YOLO目标检测专栏探讨了对YOLO框架的创新改进，如中心化特征金字塔（CFP）。CFP引入了空间显式视觉中心方案和全局集中特征规范，通过轻量级MLP与并行视觉中心机制强化特征表示，尤其利于小目标检测。在YOLOv5和YOLOX基础上，CFP实现性能提升。相关代码示例展示了EVCBlock的结构，整合了LVCBlock和LightMLPBlock。更多详情和配置参见[YOLO基础解析+创新改进+实战案例](https://blog.csdn.net/shangyanaf/category_12303415.html)。
07.08 11:14:33

发表了文章 2024-07-08 11:14:33

【YOLOv10改进-注意力机制】LSKNet(Large Selective Kernel Network ):空间选择注意力

YOLOv10专栏聚焦遥感目标检测，提出LSKNet，首个探索大型选择性核的模型。LSKNet利用LSKblock Attention动态调整感受野，处理不同目标的上下文。创新点还包括极化滤波和增强技术，提升信息保留和非线性输出。在HRSC2016等遥感基准上取得SOTA性能。LSKNet代码展示其网络结构，包括多阶段模块和注意力机制。详细配置和任务说明见相关链接。
07.08 11:13:09

发表了文章 2024-07-08 11:13:09

【YOLOv10改进-注意力机制】Polarized Self-Attention: 极化自注意力，双重注意力机制

YOLOv10引入了极化自注意（PSA）块，结合通道和空间注意力，降低信息损失。PSA通过极化过滤保持高分辨率，并用增强处理非线性分布。在2D姿态估计和分割任务上提升1-2点精度，相比基线提升2-4点。代码示例展示了PSA模块如何集成到模型中。更多配置详情见相关链接。
07.08 11:08:41

发表了文章 2024-07-08 11:08:41

【YOLOv10改进-特征融合】YOLO-MS MSBlock : 分层特征融合策略

YOLOv10专栏介绍了YOLO-MS，一个优化多尺度目标检测的高效框架。YOLO-MS通过MS-Block和异构Kernel选择提升性能，平衡了计算复杂度与准确性。它在不依赖预训练的情况下，在COCO上超越同类模型，如YOLO-v7和RTMDet。MS-Block包含不同大小卷积的分支，用于增强特征表示。代码示例展示了MSBlock类的定义，用于处理不同尺度特征。该模块可应用于其他YOLO模型以提升性能。更多详情和配置参见相关链接。
07.08 11:07:05

发表了文章 2024-07-08 11:07:05

【YOLOv10改进-注意力机制】CoordAttention：用于移动端的高效坐标注意力机制

YOLOv10专栏探讨了将位置信息融入通道注意力的创新方法，提出“坐标注意力”机制，改善移动网络性能。该机制通过两个1D特征编码捕捉空间依赖并保持位置细节，生成增强对象表示的注意力图。简单易整合到现有网络如MobileNet，几乎无额外计算成本，且在ImageNet及目标检测等任务中表现优越。实现代码展示了CoordAtt模块的工作流程。更多详情和配置见链接。
07.08 09:42:46

发表了文章 2024-07-08 09:42:46

【YOLOv10改进-注意力机制】iRMB：倒置残差移动块 (论文笔记+引入代码)

YOLOv10专栏介绍了融合CNN与Transformer的iRMB模块，用于轻量级模型设计。iRMB在保持高效的同时结合了局部和全局信息处理，减少了资源消耗，提升了移动端性能。在ImageNet等基准上超越SOTA，且在目标检测等任务中表现优秀。代码示例展示了iRMB的实现细节，包括自注意力机制和卷积操作的整合。更多配置信息见相关链接。
07.08 09:40:21

发表了文章 2024-07-08 09:40:21

【YOLOv10改进-注意力机制】 MSDA：多尺度空洞注意力 (论文笔记+引入代码)

YOLO目标检测专栏探讨了ViT的改进，提出DilateFormer，它结合多尺度扩张注意力（MSDA）来平衡计算效率和关注域大小。MSDA利用局部稀疏交互减少冗余，通过不同头部的扩张率捕获多尺度特征。DilateFormer在保持高性能的同时，计算成本降低70%，在ImageNet-1K、COCO和ADE20K任务上取得领先结果。YOLOv8引入了MultiDilatelocalAttention模块，用于实现膨胀注意力。更多详情及配置见相关链接。
07.08 09:38:53

发表了文章 2024-07-08 09:38:53

【YOLOv10改进-注意力机制】MSCAAttention多尺度卷积注意力

YOLOv10专栏介绍了一种新的卷积网络架构SegNeXt，它在语义分割任务中展现出优于Transformer模型的效率和效果。SegNeXt通过名为Multi-Scale Convolutional Attention (MSCA)的组件，结合局部信息聚合、多尺度上下文捕获和通道关系模拟，提升了性能。在多个数据集上，SegNeXt以较少参数实现了超过现有SOTA的性能，特别是在Pascal VOC 2012上，以1/10的参数量达到90.6%的mIoU。YOLOv10引入了MSCA模块，用于增强目标检测的上下文关注。相关代码和配置详情可在链接中找到。
07.08 09:31:20

发表了文章 2024-07-08 09:31:20

【YOLOv10改进-卷积Conv】 SPD-Conv空间深度转换卷积，处理低分辨率图像和小对象问题

YOLO目标检测专栏探讨了CNN在低分辨率和小目标检测中的局限性，提出SPD-Conv新架构，替代步长卷积和池化层，通过空间到深度层和非步长卷积保持细粒度信息。创新点包括消除信息损失、通用设计和性能提升。YOLOv5和ResNet应用SPD-Conv后，在困难任务上表现优越。详情见YOLO有效改进系列及项目实战目录。
07.08 09:30:07

发表了文章 2024-07-08 09:30:07

【YOLOv10改进- 特征融合NECK】BiFPN：加权双向特征金字塔网络

YOLOv10专栏探讨了目标检测的效率提升，提出BiFPN，一种带加权和自适应融合的双向特征金字塔网络，优化了多尺度信息传递。EfficientDet系列利用这些创新在效率与性能间取得更好平衡，D7模型在COCO测试集上达到55.1 AP。YOLOv8引入MPDIoU，结合BiFPN学习分支权重，提高检测精度。详情见[YOLOv10 创新改进](https://blog.csdn.net/shangyanaf/category_12712258.html)和相关文章。
07.08 09:26:18

发表了文章 2024-07-08 09:26:18

【YOLOv10改进-损失函数】Shape-IoU：考虑边框形状与尺度的指标

YOLO目标检测专栏探讨了边框回归损失的创新方法，强调了目标形状和尺度对结果的影响。提出的新方法Shape-IoU关注边框自身属性，通过聚焦形状和尺度提高回归精度。实验显示，该方法提升了检测效果，超越现有技术，在多个任务中达到SOTA。论文和代码已公开。
07.08 09:25:06

发表了文章 2024-07-08 09:25:06

【YOLOv10改进-卷积Conv】RFAConv：感受野注意力卷积，创新空间注意力

【YOLO目标检测专栏】探索空间注意力局限，提出感受野注意力（RFA）机制，解决卷积核参数共享问题。RFAConv增强大尺寸卷积核处理能力，不增加计算成本，提升网络性能。已在YOLOv8中实现，详情见YOLO目标检测创新改进与实战案例专栏。
07.04 20:13:27

发表了文章 2024-07-04 20:13:27

【YOLOv10改进-卷积Conv】SCConv ：即插即用的空间和通道重建卷积

YOLOv10专栏介绍了将Swin Transformer应用于目标检测的创新。Swin Transformer采用分层窗口结构，解决了视觉任务中的尺度变化问题，提供线性复杂度的效率提升。在图像分类、目标检测和语义分割任务中表现出色，超越先前最佳模型。YOLOv10结合Swin Transformer，利用其局部注意力机制和层次化设计，提升了检测性能。提供的代码片段展示了Swin Transformer模块，包括窗口划分、注意力计算和相对位置偏置。更多信息可在相关博客文章中找到。
07.04 20:11:13

发表了文章 2024-07-04 20:11:13

【YOLOv10改进-卷积Conv】动态蛇形卷积（Dynamic Snake Convolution）用于管状结构分割任务

YOLOv10专栏介绍了一种用于精确分割管状结构的新方法DSCNet，它结合了动态蛇形卷积、多视角融合和拓扑连续性约束损失。DSConv创新地聚焦细长局部结构，增强管状特征感知，而多视角融合和TCLoss则改善了全局形态理解和分割连续性。在2D和3D数据集上的实验显示，DSCNet在血管和道路等分割任务上超越了传统方法。DySnakeConv模块整合到YOLOv10中，提升了目标检测的准确性。[链接指向详细文章](https://blog.csdn.net/shangyanaf/article/details/140007047)
07.04 20:07:59

发表了文章 2024-07-04 20:07:59

【YOLOv10改进 -卷积Conv】 AKConv(可改变核卷积)：任意数量的参数和任意采样形状的即插即用的卷积

AKConv是一种可改变核卷积，旨在解决传统卷积的局限，包括固定大小的卷积窗口和卷积核尺寸。AKConv提供灵活的卷积核参数和采样形状，适应不同尺度特征。其创新点包括：1）支持任意大小和形状的卷积核；2）使用新算法确定初始采样位置；3）应用动态偏移调整采样位置；4）优化模型参数和计算效率。AKConv已应用于YOLOv8，提高网络性能。相关代码可在<https://github.com/CV-ZhangXin/AKConv>找到。

2024年06月

06.30 21:56:19

发表了文章 2024-06-30 21:56:19

【YOLOv8改进 - 注意力机制】SimAM：轻量级注意力机制，解锁卷积神经网络新潜力

YOLO目标检测专栏介绍了SimAM，一种无参数的CNN注意力模块，基于神经科学理论优化能量函数，提升模型表现。SimAM通过计算3D注意力权重增强特征表示，无需额外参数。文章提供论文链接、Pytorch实现代码及详细配置，展示了如何在目标检测任务中应用该模块。
06.30 21:54:18

发表了文章 2024-06-30 21:54:18

【YOLOv8改进 - 注意力机制】NAM：基于归一化的注意力模块，将权重稀疏惩罚应用于注意力机制中，提高效率性能

**NAM: 提升模型效率的新颖归一化注意力模块，抑制非显著权重，结合通道和空间注意力，通过批量归一化衡量重要性。在Resnet和Mobilenet上的实验显示优于其他三种机制。源码见[GitHub](https://github.com/Christian-lyc/NAM)。**
06.29 09:39:05

发表了文章 2024-06-29 09:39:05

【YOLOv8改进-损失函数】SlideLoss损失函数，解决样本不平衡问题

YOLO-FaceV2是基于YOLOv5的实时人脸检测模型，采用RFE模块增强小人脸检测，NWD损失处理定位偏差，SEAM注意力模块应对遮挡，Slide Loss解决样本不平衡，提升对难样本的关注。在WiderFace数据集上超越YOLO系列。论文和代码已公开。Slide Loss通过IoU加权，优化边界样本，提高模型性能。
06.29 09:36:26

发表了文章 2024-06-29 09:36:26

【YOLOv8改进-卷积Conv】DualConv( Dual Convolutional)：用于轻量级深度神经网络的双卷积核

**摘要：** 我们提出DualConv，一种融合$3\times3$和$1\times1$卷积的轻量级DNN技术，适用于资源有限的系统。它通过组卷积结合两种卷积核，减少计算和参数量，同时增强准确性。在MobileNetV2上，参数减少54%，CIFAR-100精度仅降0.68%。在YOLOv3中，DualConv提升检测速度并增4.4%的PASCAL VOC准确性。论文及代码已开源。
06.29 09:33:39

发表了文章 2024-06-29 09:33:39

【YOLOv8改进-卷积Conv】 OREPA(Online Convolutional Re-parameterization)：在线卷积重参数化

**OREPA**是在线卷积重参数化的缩写，它提出了一种两阶段流程来减少深度模型训练的开销。该方法通过线性缩放层优化复杂训练块，并在训练完成后将其压缩为单个卷积层，降低内存使用和提高训练速度。与现有技术相比，OREPA能减少约70%的训练内存开销，提升2倍训练速度，并在ImageNet上提高最多0.6%的准确性。此外，它还在目标检测和语义分割任务中表现出色。论文和代码可在提供的链接中找到。
06.29 09:22:58

发表了文章 2024-06-29 09:22:58

【YOLOv8改进】 RFB (Receptive Field Block)：多分支卷积块

**RFB Net是针对目标检测的轻量级解决方案，它通过设计灵感来自人眼感受野的模块提升特征表示。RFB块包含多分支卷积，模拟不同尺度和偏心率，增强轻量模型如SSD的性能。在保持实时速度的同时，RFB Net在准确性上媲美深度检测器。代码可在GitHub找到。**
06.26 22:47:55

发表了文章 2024-06-26 22:47:55

【YOLOv8改进 - 注意力机制】Triplet Attention：轻量有效的三元注意力

**摘要：** 本文提出TripletAttention，一种轻量级的计算机视觉注意力机制，通过三分支结构增强跨维度交互。该方法利用旋转操作和残差变换在通道和空间维度上建立依赖，提升模型性能，同时保持低计算成本。作为附加模块，它能集成到现有骨干网络中，适用于图像分类及目标检测等任务。实验证实在ImageNet-1k、MSCOCO和PASCAL VOC上取得良好效果，并提供GradCAM可视化分析。代码已开源：[GitHub](https://github.com/LandskapeAI/triplet-attention)。
06.22 10:41:59

发表了文章 2024-06-22 10:41:59

【YOLOv8改进 - 特征融合NECK】Slim-neck：目标检测新范式，既轻量又涨点

YOLO目标检测专栏探讨了模型优化，提出GSConv和Slim-Neck设计，以实现轻量级模型的高效检测。GSConv减小计算复杂度，保持准确性，适合实时任务。Slim-Neck结合GSConv优化架构，提高计算成本效益。在Tesla T4上，改进后的检测器以100FPS处理SODA10M数据集，mAP0.5达70.9%。论文和代码可在提供的链接中获取。文章还介绍了YOLOv8中GSConv的实现细节。更多配置信息见相关链接。
06.22 10:11:55

发表了文章 2024-06-22 10:11:55

【YOLOv8改进 - 特征融合NECK】 HS-FPN ：用于处理多尺度特征融合的网络结构,降低参数

MFDS-DETR是针对白细胞检测的创新方法，它通过HS-FPN和可变形自注意力解决规模差异和特征稀缺问题。HS-FPN利用通道注意力模块增强特征表达，改善多尺度挑战。代码和数据集可在给定链接获取。此方法在WBCDD、LISC和BCCD数据集上表现优越，证明了其有效性和通用性。YOLO系列文章提供了更多目标检测改进和实战案例。
06.20 22:24:34

发表了文章 2024-06-20 22:24:34

【YOLOv8改进】 ParameterNet：DynamicConv(Dynamic Convolution)：2024最新动态卷积

**摘要** ParameterNet是新提出的框架，旨在让低FLOPs模型也能受益于大规模视觉预训练，通过动态卷积在增加参数量的同时控制计算量。动态卷积利用条件生成的卷积核增强模型适应性。在ImageNet上，ParameterNet-600M在准确性上超过Swin Transformer，且FLOPs更低。该方法也被拓展至语言领域，提升LLaMA模型性能。代码可在<https://parameternet.github.io/>获取。
06.20 22:22:15

发表了文章 2024-06-20 22:22:15

【YOLOv8改进】 SAConv(Switchable Atrous Convolution)：可切换的空洞卷积

**DetectoRS是目标检测的先进网络，融合递归特征金字塔和可切换空洞卷积。递归金字塔在FPN基础上增加反馈，增强特征表示。SAC使用不同空洞率卷积并用开关函数融合，适应不同尺度目标。在COCO数据集上，DetectoRS达到55.7%的Box AP，48.5%的Mask AP和50.0%的
06.20 22:19:38

发表了文章 2024-06-20 22:19:38

【YOLOv8改进】 ODConv(Omni-Dimensional Dynamic Convolution)：全维度动态卷积

ODConv是一种增强型动态卷积方法，通过多维注意力机制在卷积的四个维度上学习互补注意力，提升轻量级CNN准确性和效率。与现有动态卷积不同，ODConv覆盖了空间、输入/输出通道和核数维度。在ImageNet和MS-COCO上，对MobileNetV2|ResNet等模型有显著性能提升，减少参数的同时超越传统方法。代码和论文链接可用。在YOLO系列中，ODConv改进了特征学习，优化了目标检测性能。
06.20 22:17:44

发表了文章 2024-06-20 22:17:44

【YOLOv8改进】BRA(bi-level routing attention ):双层路由注意力(论文笔记+引入代码)

**BiFormer和HCANet摘要** BiFormer是CVPR2023提出的一种新型视觉Transformer，采用双层路由注意力机制实现动态稀疏注意力，优化计算效率和内存使用，适用于图像分类、目标检测和语义分割任务。代码可在GitHub获取。另一方面，HCANet是针对高光谱图像去噪的深度学习模型，融合CNN和Transformer，强化全局和局部特征建模，通过多尺度前馈网络提升去噪效果。HCANet在HSI数据集上表现优秀，其代码同样开放源代码。
06.20 22:15:40

发表了文章 2024-06-20 22:15:40

【YOLOv8改进】MSFN(Multi-Scale Feed-Forward Network):多尺度前馈网络

**HCANet: 高光谱图像去噪新方法**\n混合卷积与注意力网络(Hybrid Convolutional and Attention Network)是针对HSI去噪的创新模型，结合CNN和Transformer，强化全局与局部特征。它使用卷积注意力融合模块捕获长距离依赖和局部光谱相关性，多尺度前馈网络提升多尺度信息聚合。代码可在[GitHub](https://github.com/summitgao/HCANet)获取。
06.20 21:36:33

发表了文章 2024-06-20 21:36:33

【YOLOv8改进】CAFM(Convolution and Attention Fusion Module):卷积和注意力融合模块

**HCANet: 高光谱图像去噪新方法** HCANet是一种结合CNN与Transformer的深度学习模型，专为高光谱图像设计。它使用卷积注意力融合模块（CAFM）捕捉局部和全局特征，并通过多尺度前馈网络（MSFN）增强多尺度信息聚合，提升去噪效果。CAFM包含卷积和注意力分支，整合局部细节与长距离依赖。代码已开源：[GitHub](https://github.com/summitgao/HCANet)。
06.20 21:32:27

发表了文章 2024-06-20 21:32:27

【YOLOv8改进】MLCA(Mixed local channel attention):混合局部通道注意力(论文笔记+引入代码)

**摘要：** 本文提出轻量级MLCA模块，结合通道、空间、局部及全局信息，提升网络表达效率。在MobileNet-Attention-YOLO(MAY)中应用MLCA，于PASCAL VOC和SMID数据集上对比SE和CA，mAP提升1.0%和1.5%。论文及代码链接提供。MLCA通过局部池化和反池化处理，增强通道交互和空间信息，实现更精确的目标检测。详情见YOLO改进与实战专栏。
06.02 09:57:49

发表了文章 2024-06-02 09:57:49

【YOLOv8改进】CoTAttention:上下文转换器注意力(论文笔记+引入代码)

本文介绍了YOLO目标检测的创新改进，提出了一种名为Contextual Transformer (CoT)块的新型Transformer模块，用于增强视觉识别能力。CoT块通过3×3卷积编码上下文信息，并结合动态多头注意力矩阵，提高了视觉表示。此外，还提到了Large Separable Kernel Attention (LSKA)模块，它解决了大内核卷积的计算效率问题。CoTNet是基于CoT模块的Transformer风格骨干网络，可替代ResNet中的3×3卷积。CoTAttention类展示了如何在YOLOv8中集成此模块。文章还提供了源码链接和更多实战案例详情。
06.01 11:36:01

发表了文章 2024-06-01 11:36:01

【YOLOv8改进】LSKA(Large Separable Kernel Attention)：大核分离卷积注意力模块 (论文笔记+引入代码)

YOLO目标检测专栏介绍了大可分卷积核注意力模块LSKA，用于解决VAN中大卷积核效率问题。LSKA通过分解2D卷积为1D卷积降低计算复杂度和内存占用，且使模型关注形状而非纹理，提高鲁棒性。在多种任务和数据集上，LSKA表现优于ViTs和ConvNeXt，代码可在GitHub获取。基础原理包括LSKA的卷积核分解设计和计算效率优化。示例展示了LSKA模块的实现。更多详情及配置参见相关链接。
06.01 11:33:56

发表了文章 2024-06-01 11:33:56

【YOLOv8改进】D-LKA Attention：可变形大核注意力 (论文笔记+引入代码)

YOLO目标检测专栏探讨了Transformer在医学图像分割的进展，但计算需求限制了模型的深度和分辨率。为此，提出了可变形大核注意力（D-LKA Attention），它使用大卷积核捕捉上下文信息，通过可变形卷积适应数据模式变化。D-LKA Net结合2D和3D版本的D-LKA Attention，提升了医学分割性能。YOLOv8引入了可变形卷积层以增强目标检测的准确性。相关代码和任务配置可在作者博客找到。
06.01 11:22:09

发表了文章 2024-06-01 11:22:09

【YOLOv8改进】DAT（Deformable Attention）：可变性注意力 (论文笔记+引入代码)

YOLO目标检测创新改进与实战案例专栏探讨了YOLO的有效改进，包括卷积、主干、注意力和检测头等机制的创新，以及目标检测分割项目的实践。专栏介绍了Deformable Attention Transformer，它解决了Transformer全局感受野带来的问题，通过数据依赖的位置选择、灵活的偏移学习和全局键共享，聚焦相关区域并捕获更多特征。模型在多个基准测试中表现优秀，代码可在GitHub获取。此外，文章还展示了如何在YOLOv8中应用Deformable Attention。
06.01 10:57:26

发表了文章 2024-06-01 10:57:26

【YOLOv8改进】CPCA(Channel prior convolutional attention)中的通道注意力,增强特征表征能力 (论文笔记+引入代码)

该专栏聚焦YOLO目标检测的创新改进与实战，介绍了一种针对医学图像分割的通道优先卷积注意力（CPCA）方法。CPCA结合通道和空间注意力，通过多尺度深度卷积提升性能。提出的CPCANet网络在有限计算资源下，于多个数据集上展现优越分割效果。代码已开源。了解更多详情，请访问提供的专栏链接。
06.01 10:54:54

发表了文章 2024-06-01 10:54:54

【YOLOv8改进】EMA（Efficient Multi-Scale Attention）：基于跨空间学习的高效多尺度注意力 (论文笔记+引入代码)

YOLO目标检测专栏介绍了创新的多尺度注意力模块EMA，它强化通道和空间信息处理，同时降低计算负担。EMA模块通过通道重塑和并行子网络优化特征表示，增强长距离依赖建模，在保持效率的同时提升模型性能。适用于图像分类和目标检测任务，尤其在YOLOv8中表现出色。代码实现和详细配置可在文中链接找到。
06.01 10:53:11

发表了文章 2024-06-01 10:53:11

【YOLOv8改进】ACmix(Mixed Self-Attention and Convolution) (论文笔记+引入代码)

YOLO目标检测专栏探讨了YOLO的改进，包括卷积和自注意力机制的创新结合。研究发现两者在计算上存在关联，卷积可分解为1×1卷积，自注意力也可视为1×1卷积的变形。由此提出ACmix模型，它整合两种范式，降低计算开销，同时提升图像识别和下游任务的性能。ACmix优化了移位操作，采用模块化设计，实现两种技术优势的高效融合。代码和预训练模型可在相关GitHub和MindSpore模型库找到。 yolov8中引入了ACmix模块，详细配置参见指定链接。
06.01 10:50:12

发表了文章 2024-06-01 10:50:12

【YOLOv8改进】HAT(Hybrid Attention Transformer,)混合注意力机制 (论文笔记+引入代码)

YOLO目标检测专栏介绍了YOLO系列的改进方法和实战应用，包括卷积、主干网络、注意力机制和检测头的创新。提出的Hybrid Attention Transformer (HAT)结合通道注意力和窗口自注意力，激活更多像素以提升图像超分辨率效果。通过交叉窗口信息聚合和同任务预训练策略，HAT优化了Transformer在低级视觉任务中的性能。实验显示，HAT在图像超分辨率任务上显著优于现有方法。模型结构包含浅层和深层特征提取以及图像重建阶段。此外，提供了HAT模型的PyTorch实现代码。更多详细配置和任务说明可参考相关链接。
06.01 10:47:50

发表了文章 2024-06-01 10:47:50

【YOLOv8改进】STA(Super Token Attention) 超级令牌注意力机制 (论文笔记+引入代码)

该专栏探讨YOLO目标检测的创新改进和实战应用，介绍了使用视觉Transformer的新方法。为解决Transformer在浅层处理局部特征时的冗余问题，提出了超级令牌（Super Tokens）和超级令牌注意力（STA）机制，旨在高效建模全局上下文。通过稀疏关联学习和自注意力处理，STA降低了计算复杂度，提升了全局依赖的捕获效率。由此构建的层次化视觉Transformer在ImageNet-1K、COCO检测和ADE20K语义分割任务上展现出优秀性能。此外，文章提供了YOLOv8中实现STA的代码示例。更多详细信息和配置可在相关链接中找到。
06.01 10:43:49

发表了文章 2024-06-01 10:43:49

【YOLOv8改进】Non-Local：基于非局部均值去噪滤波的自注意力模型 (论文笔记+引入代码)

YOLO目标检测专栏探讨了YOLO的创新改进，包括引入非局部操作以捕获远程依赖，增强上下文信息。非局部模块可应用于图像分类、目标检测等任务，尤其适合视频分类。文章介绍了Non-local自注意力模型，通过计算任意位置间交互，提供全局信息。此外，展示了如何在YOLOv8中实现NLBlockND模块。详细内容及实战配置见相关链接。

...

发表了文章 2024-11-07

【YOLOv11改进 - 注意力机制】SimAM：轻量级注意力机制，解锁卷积神经网络新潜力
发表了文章 2024-11-07

【YOLOv11改进 - 注意力机制】 MSDA（Multi-Scale Dilated Attention）：多尺度空洞注意力
发表了文章 2024-11-07

【YOLOv11改进 - 注意力机制】 MHSA：多头自注意力（Multi-Head Self-Attention）
发表了文章 2024-11-07

【YOLOv11改进 - 注意力机制】MLCA(Mixed local channel attention):混合局部通道注意力
发表了文章 2024-11-07

【YOLOv11改进 - 注意力机制】GAM（Global Attention Mechanism）：全局注意力机制，减少信息损失并放大全局维度交互特征
发表了文章 2024-11-07

【YOLOv11改进 - 注意力机制】EMA（Efficient Multi-Scale Attention）：基于跨空间学习的高效多尺度注意力
发表了文章 2024-11-07

【YOLOv11改进 - 注意力机制】iRMB：倒置残差移动块，即插即用的轻量注意力
发表了文章 2024-11-07

【YOLOv11改进 - 注意力机制】CoTAttention:上下文转换器注意力
发表了文章 2024-11-07

YOLOv11 正式发布！你需要知道什么? 另附：YOLOv8 与YOLOv11 各模型性能比较
发表了文章 2024-11-07

YOLO11创新改进系列：卷积，主干注意力，C3k2融合，检测头等创新机制（已更新100+）
发表了文章 2024-11-05

【YOLO11改进 - C3k2融合】C3k2DWRSeg二次创新C3k2_DWR：扩张式残差分割网络，提高特征提取效率和多尺度信息获取能力，助力小目标检测
发表了文章 2024-11-05

【YOLO11改进 - C3k2融合】C3k2融合DWRSeg二次创新C3k2_DWRSeg：扩张式残差分割网络，提高特征提取效率和多尺度信息获取能力，助力小目标检测
发表了文章 2024-11-01

【YOLOv11改进 - 注意力机制】LSKA(Large Separable Kernel Attention)：大核分离卷积注意力模块
发表了文章 2024-10-30

【YOLO11改进 - C3k2融合】C3k2融合YOLO-MS的MSBlock : 分层特征融合策略，轻量化网络结构
发表了文章 2024-07-27

【YOLOv8改进 - 注意力机制】c2f结合CBAM：针对卷积神经网络（CNN）设计的新型注意力机制
发表了文章 2024-07-27

【YOLOv8改进 - 特征融合】DySample ：超轻量级且高效的动态上采样器
发表了文章 2024-07-27

【YOLOv8改进 - 特征融合】CARAFE：轻量级新型上采样算子，助力细节提升
发表了文章 2024-07-27

【YOLOv8改进 - 特征融合NECK】 DAMO-YOLO之RepGFPN ：实时目标检测的创新型特征金字塔网络
发表了文章 2024-07-27

【YOLOv8改进 - 特征融合】 YOGA iAFF ：注意力机制在颈部的多尺度特征融合
发表了文章 2024-07-27

【YOLOv8改进 - Backbone主干】清华大学CloFormer AttnConv ：利用共享权重和上下文感知权重增强局部感知，注意力机制与卷积的完美融合

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息

YOLO创新改进大师_社区达人页

探索云世界

热门

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

勋章 更多

成就

我关注的人 更多

粉丝 更多

技术能力

【YOLOv11改进 - 注意力机制】SimAM：轻量级注意力机制，解锁卷积神经网络新潜力

【YOLOv11改进 - 注意力机制】 MSDA（Multi-Scale Dilated Attention）：多尺度空洞注意力

【YOLOv11改进 - 注意力机制】 MHSA：多头自注意力（Multi-Head Self-Attention）

【YOLOv11改进 - 注意力机制】MLCA(Mixed local channel attention):混合局部通道注意力

【YOLOv11改进 - 注意力机制】GAM（Global Attention Mechanism）：全局注意力机制，减少信息损失并放大全局维度交互特征

【YOLOv11改进 - 注意力机制】EMA（Efficient Multi-Scale Attention）：基于跨空间学习的高效多尺度注意力

【YOLOv11改进 - 注意力机制】iRMB： 倒置残差移动块，即插即用的轻量注意力

【YOLOv11改进 - 注意力机制】CoTAttention:上下文转换器注意力

YOLOv11 正式发布！你需要知道什么? 另附：YOLOv8 与YOLOv11 各模型性能比较

YOLO11创新改进系列：卷积，主干 注意力，C3k2融合，检测头等创新机制（已更新100+）

【YOLO11改进 - C3k2融合】C3k2DWRSeg二次创新C3k2_DWR：扩张式残差分割网络，提高特征提取效率和多尺度信息获取能力，助力小目标检测

【YOLO11改进 - C3k2融合】C3k2融合DWRSeg二次创新C3k2_DWRSeg：扩张式残差分割网络，提高特征提取效率和多尺度信息获取能力，助力小目标检测

【YOLOv11改进 - 注意力机制】LSKA(Large Separable Kernel Attention)：大核分离卷积注意力模块

【YOLO11改进 - C3k2融合】C3k2融合YOLO-MS的MSBlock : 分层特征融合策略，轻量化网络结构

【YOLOv8改进 - 注意力机制】c2f结合CBAM：针对卷积神经网络（CNN）设计的新型注意力机制

【YOLOv8改进 - 特征融合】DySample ：超轻量级且高效的动态上采样器

【YOLOv8改进 - 特征融合】CARAFE：轻量级新型上采样算子，助力细节提升

【YOLOv8改进 - 特征融合NECK】 DAMO-YOLO之RepGFPN ：实时目标检测的创新型特征金字塔网络

【YOLOv8改进 - 特征融合】 YOGA iAFF ：注意力机制在颈部的多尺度特征融合

【YOLOv8改进 - Backbone主干】清华大学CloFormer AttnConv ：利用共享权重和上下文感知权重增强局部感知，注意力机制与卷积的完美融合

勋章更多

我关注的人更多

粉丝更多

【YOLOv11改进 - 注意力机制】iRMB：倒置残差移动块，即插即用的轻量注意力

YOLO11创新改进系列：卷积，主干注意力，C3k2融合，检测头等创新机制（已更新100+）