YOLO系列的落地 | YOLOv7+注意力机制在农业上的应用(二)

简介: YOLO系列的落地 | YOLOv7+注意力机制在农业上的应用(二)

2.6 Related Network

本节首先介绍了YOLOv7算法,然后详细介绍了本文提出的在YOLOv7中添加注意力机制的改进方法。

2.6.1 YOLOv7

本文提出了一种基于计算机视觉的基于家鸭目标检测和种群统计的识别和检测算法。利用该算法,育种者可以实时获取野鸭的数量和行为动态,实现养殖场的快速管理和战略制定,优化野鸭的繁殖率和生长速度,有助于实现经济效益的最大化。

鉴于鸭种群中个体密度小,且种群统计的实时要求,选择了最新的Yolov7模型。“你只看一次(Yolov7)是一种单阶段目标检测算法。图5为Yolov7的网络结构图。将Yolov7模型预处理方法与Yolov5集成,使用镶嵌数据增强适用于小目标检测。在体系结构方面,提出了基于ELAN的扩展ELAN(E-ELAN)。利用扩展、shuffle和合并基数,在不破坏原始梯度路径的情况下,不断提高网络的学习能力。在计算块的体系结构中,利用群卷积来扩展计算块的通道和基数。不同的计算块组被引导去学习更多样化的特征。

然后,它重点关注一些优化模块和方法,称为可训练的“bag-of-freebies”,包括以下内容:

  1. 采用无Identity的RepConv设计了规划的重参化卷积体系结构,为不同的特征图提供了更多的梯度多样性。
  2. 介绍了辅助检测头,并利用优化过程生成的软标签用于Lead Head和辅助头的学习。因此,由此生成的软标签应该能更好地表示源数据与目标之间的分布和相关性,从而获得更准确的结果。
  • 批次归一化层直接连接到卷积层,使得批次的归一化平均值和方差在推断阶段被集成到卷积层的偏差和权重中。
  • 利用YOLOR中隐式知识的加法和乘法方法,结合卷积特征映射,可以在推理阶段通过预先计算将其简化为向量,从而结合之前或后续卷积层的偏差和权重。
  • EMA模型纯粹被用作最终的推理模型。最后,实时目标检测可以在不增加推理成本的情况下大大提高检测精度,使5-160FPS范围内的速度和精度超过所有已知的目标检测器,可以实现目标检测的快速响应和准确预测。

2.6.2 改进注意力机制的YOLOv7

注意力机制是一种常见的数据处理方法,广泛应用于各个领域的机器学习任务。计算机视觉注意力机制的核心思想是找到原始数据之间的相关性,然后突出重要的特征,如通道注意力、像素注意力、多阶注意力等。

CBAM主要包括通道注意力模块和空间注意力模块。模块结构如图6所示。

CBAM是一个轻量级的注意力模块,可以在通道和空间维度上执行注意力操作。它由通道注意力模块(CAM)和空间注意力模块(SAM)组成。CAM可以使网络更加关注图像的前景和有意义的区域,而SAM可以使网络更关注富含整个画面上下文信息的位置。

2.6.3 YOLOv7 Introduces the CBAM Attention Mechanism

CBAM注意力机制被添加到YOLOV7网络结构中,网络结构如图7所示。该模块的功能是进一步提高特征提取网络的特征提取能力。一旦将注意力机制添加到骨干网络中,注意力机制模块就会降低骨干网络的一些原始权重。这导致网络的预测结果出现错误。在这方面选择将注意力机制添加到增强特征网络提取的部分,而不破坏网络提取的原始特征。

image.png

CBAM注意机制的工作原理如下:

在通道注意力模块中,对H×W×C的输入特征图进行全局最大池化(GMP)和全局平均池化(GAP),得到2个大小为1×1×C的特征图。这2个特征图被发送到一个两层的多层感知器。MLP第一层的神经元数量为C/r(r为还原率),激活函数为ReLU。第二层神经元的数量为C,这两层神经网络的权值被共享。然后,基于元素级计算添加输出特征,并通过sigmoid生成最终的通道附着特征。最后,将通道注意力特征乘以原始输入特征图,得到空间注意力模块的输入特征。

在空间注意模块中,使用上一步中的特征图作为输入。

经过GMP和GAP后,得到了2个大小为H×W×1的特征图。然后执行Concat操作。将特征图降维后,通过sigmoid生成空间注意力特征。最后,将空间注意力特征乘以输入的特征图,得到最终的特征图。


3、实验结果


image.pngimage.png

3.1 目标检测网络比较实验结果

image.png

3.2 引入注意机制的对比实验结果

image.pngimage.png

3.3 不同数据标注方法的实验结果比较

image.png

3.4 消融实验结果

image.pngimage.pngimage.png


4、参考


[1]. An Attention Mechanism-Improved YOLOv7 Object Detection Algorithm for Hemp Duck Count Estimation.

相关文章
|
机器学习/深度学习 计算机视觉 网络架构
改进YOLOv8:添加CBAM注意力机制(涨点明显)
改进YOLOv8:添加CBAM注意力机制(涨点明显)
8521 1
|
机器学习/深度学习 数据可视化 计算机视觉
YOLOv11改进策略【注意力机制篇】| 2024 SCSA-CBAM 空间和通道的协同注意模块
YOLOv11改进策略【注意力机制篇】| 2024 SCSA-CBAM 空间和通道的协同注意模块
1364 2
YOLOv11改进策略【注意力机制篇】| 2024 SCSA-CBAM 空间和通道的协同注意模块
|
机器学习/深度学习 监控 计算机视觉
目标检测实战(八): 使用YOLOv7完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
本文介绍了如何使用YOLOv7进行目标检测,包括环境搭建、数据集准备、模型训练、验证、测试以及常见错误的解决方法。YOLOv7以其高效性能和准确率在目标检测领域受到关注,适用于自动驾驶、安防监控等场景。文中提供了源码和论文链接,以及详细的步骤说明,适合深度学习实践者参考。
3807 1
目标检测实战(八): 使用YOLOv7完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
|
编解码 异构计算
YOLOv11改进策略【Neck】| BiFPN:双向特征金字塔网络-跨尺度连接和加权特征融合
YOLOv11改进策略【Neck】| BiFPN:双向特征金字塔网络-跨尺度连接和加权特征融合
3451 7
YOLOv11改进策略【Neck】| BiFPN:双向特征金字塔网络-跨尺度连接和加权特征融合
|
机器学习/深度学习 人工智能 并行计算
YOLOv11改进策略【YOLO和Mamba】| MLLA:Mamba-Like Linear Attention,融合Mamba设计优势的注意力机制
YOLOv11改进策略【YOLO和Mamba】| MLLA:Mamba-Like Linear Attention,融合Mamba设计优势的注意力机制
836 9
|
机器学习/深度学习 存储 TensorFlow
YOLOv11改进策略【Head】| (独家改进)轻量化检测头:利用 EfficientNet 中的移动倒置瓶颈模块 MBConv 改进检测头
YOLOv11改进策略【Head】| (独家改进)轻量化检测头:利用 EfficientNet 中的移动倒置瓶颈模块 MBConv 改进检测头
2918 11
YOLOv11改进策略【Head】| (独家改进)轻量化检测头:利用 EfficientNet 中的移动倒置瓶颈模块 MBConv 改进检测头
|
计算机视觉
YOLOv11改进策略【Neck】| GFPN 超越BiFPN 通过跳层连接和跨尺度连接改进v11颈部网络
YOLOv11改进策略【Neck】| GFPN 超越BiFPN 通过跳层连接和跨尺度连接改进v11颈部网络
2605 10
YOLOv11改进策略【Neck】| GFPN 超越BiFPN 通过跳层连接和跨尺度连接改进v11颈部网络
|
机器学习/深度学习 计算机视觉 异构计算
YOLOv8优改系列一:YOLOv8融合BiFPN网络,实现网络快速涨点
本文介绍了将BiFPN网络应用于YOLOv8以增强网络性能的方法。通过双向跨尺度连接和加权特征融合,BiFPN能有效捕获多尺度特征,提高目标检测效果。文章还提供了详细的代码修改步骤,包括修改配置文件、创建模块文件、修改训练代码等,以实现YOLOv8与BiFPN的融合。
2704 0
YOLOv8优改系列一:YOLOv8融合BiFPN网络,实现网络快速涨点
|
机器学习/深度学习 计算机视觉 Python
YOLOv5改进系列(2)——添加CBAM注意力机制
YOLOv5改进系列(2)——添加CBAM注意力机制
11685 1
YOLOv5改进系列(2)——添加CBAM注意力机制
|
机器学习/深度学习 人工智能 文字识别
ultralytics YOLO11 全新发布!(原理介绍+代码详见+结构框图)
本文详细介绍YOLO11,包括其全新特性、代码实现及结构框图,并提供如何使用NEU-DET数据集进行训练的指南。YOLO11在前代基础上引入了新功能和改进,如C3k2、C2PSA模块和更轻量级的分类检测头,显著提升了模型的性能和灵活性。文中还对比了YOLO11与YOLOv8的区别,并展示了训练过程和结果的可视化
23412 0

热门文章

最新文章