YOLOV7详细解读(三)技术要点归纳

简介: YOLOV7详细解读(三)技术要点归纳

前言


继美团发布YOLOV6之后,YOLO系列原作者也发布了YOLOV7。

YOLOV7主要的贡献在于:


1.模型重参数化


YOLOV7将模型重参数化引入到网络架构中,重参数化这一思想最早出现于REPVGG中。


2.标签分配策略


YOLOV7的标签分配策略采用的是YOLOV5的跨网格搜索,以及YOLOX的匹配策略。


3.ELAN高效网络架构


YOLOV7中提出的一个新的网络架构,以高效为主。


4.带辅助头的训练


YOLOV7提出了辅助头的一个训练方法,主要目的是通过增加训练成本,提升精度,同时不影响推理的时间,因为辅助头只会出现在训练过程中。


一、YOLOV7是什么?


YOLO算法作为one-stage目标检测算法最典型的代表,其基于深度神经网络进行对象的识别和定位,运行速度很快,可以用于实时系统。


YOLOV7是目前YOLO系列最先进的算法,在准确率和速度上超越了以往的YOLO系列。


了解YOLOV7是对目标检测算法研究的一个必须步骤。


二、论文贡献


1.设计了几种可训练的Bag-of-Freebies方法,使得实时目标检测在不增加推理代价的情况下,大大提高了检测精度;


2.对于目标检测方法的发展,我们发现了两个新的问题,即重新参数化的模块如何替换原始模块,以及动态标签分配策略如何处理对不同输出层的分配。此外,我们还提出了解决这些问题所产生的困难的方法。


3.提出了实时目标检测器的“扩展”和“复合缩放”方法,可以有效地利用参数和计算;


4.论文提出的方法可以有效地减少现有实时目标检测器约40%的参数和50%的计算量,并具有更快的推理速度和更高的检测精度


三、相关工作


  • 更快更强的网络架构

  • 更有效的特征集成方法

  • 更准确的检测方法

  • 更鲁棒的损失函数

  • 更有效的标签分配分配

  • 更有效的训练方法

四、网络架构

image.png

五、重参数化


Step1. 融合卷积层( identity )和 BN 层,再对融合后的 1x1 卷积和 identity 进行补零(类似 padding 操作)扩展成 3x3 大小的卷积核;


Step2. 利用卷积的可加性,将 3 个 3x3 卷积合并为一个;


Step3. 完成结构重参数化,得到 plain 形式的推理模型(上一层输出为下一层输入,没有skip等分支操作)。

2.png

六、模型缩放


模型缩放通过扩大或缩小baseline,使其适用于不同的计算设备。模型缩放方法通常包括不同的缩放因子,如:


  • input size(输入图像大小)

  • depth(层数)

  • width(通道数)

  • stage(特征金字塔数量)

从而在网络的参数量、计算量、推理速度和精度方面实现很好的权衡。网络架构搜索(NAS)也是目前常用的模型缩放方法之一



七、E-ELAN


结构图

3.png

分组卷积


将卷积的输入feature map分成组,每个卷积核也相应地分成组,在对应的组内做卷积。


如下图所示,图中分组数,即上面的一组feature map只和上面的一组卷积核做卷积,下面的一组feature map只和下面的一组卷积核做卷积。每组卷积都生成一个feature map,共生成group组feature map。

4.jpeg

八、损失函数


  • 目标置信度损失:BCEWithLogitsLoss

  • 分类损失采用:BCEWithLogitsLoss

  • 坐标损失采用:CIoU损失

BCEWithLogitsLossBCELoss的区别:


该loss 层包括了 Sigmoid 层和
BCELoss 层,故而神经网络的输出无需经过sigmoid函数,其他都是一样的


九、动态标签分配策略


步骤


①yolov5:使用yolov5正负样本分配策略分配正样本。


②YOLOX:计算每个样本对每个GT的Reg+Cla loss(Loss aware)


③YOLOX:使用每个GT的预测样本确定它需要分配到的正样本数(Dynamic k)


④YOLOX:为每个GT取loss最小的前dynamic k个样本作为正样本


⑤YOLOX:人工去掉同一个样本被分配到多个GT的正样本的情况(全局信息)


软标签

4.png

yolov5的跨网格匹配

5.jpeg

YOLOX中的simOTA


1.lead head中每个网格与gt如果匹配上,附加周边两个网格


2.aux head附加4个网格(如上面导数第二幅图,匹配到浅黄+橘黄共5个网格)


3.lead head中将top10个样本iou求和取整,而aux head中取top20。


4.aux head更关注于recall,而lead head从aux head中精准筛选出样本。

6.png

7.jpeg



目录
相关文章
|
机器学习/深度学习 网络架构 计算机视觉
UNet详细解读(一)论文技术要点归纳
UNet详细解读(一)论文技术要点归纳
300 0
|
2月前
|
机器学习/深度学习 自然语言处理 数据可视化
【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现
阅读这个文章可能的收获:理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。
139 11
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
深度剖析深度神经网络(DNN):原理、实现与应用
本文详细介绍了深度神经网络(DNN)的基本原理、核心算法及其具体操作步骤。DNN作为一种重要的人工智能工具,通过多层次的特征学习和权重调节,实现了复杂任务的高效解决。文章通过理论讲解与代码演示相结合的方式,帮助读者理解DNN的工作机制及实际应用。
|
8月前
|
机器学习/深度学习 计算机视觉
YOLOv5改进 | 2023 | MPDIoU、InnerMPDIoU助力细节涨点
YOLOv5改进 | 2023 | MPDIoU、InnerMPDIoU助力细节涨点
219 0
|
8月前
|
计算机视觉 网络架构
【YOLOv8改进】MSBlock : 分层特征融合策略 (论文笔记+引入代码)
YOLO-MS是一个创新的实时目标检测器,通过多尺度构建块(MS-Block)和异构Kernel选择(HKS)协议提升多尺度特征表示能力。它在不依赖预训练权重和大型数据集的情况下,在MS COCO上超越了YOLO-v7和RTMDet,例如YOLO-MS XS版本(4.5M参数,8.7G FLOPs)达到了43%+的AP,比RTMDet高2%+。MS-Block利用分层特征融合和不同大小的卷积,而HKS协议根据网络深度调整Kernel大小,优化多尺度语义信息捕获。此外,YOLO-MS的模块化设计允许其作为即插即用的组件集成到其他YOLO模型中,提升它们的检测性能。
|
8月前
|
机器学习/深度学习 算法 PyTorch
【SAHI】即插即用| SAHI操作可有效解决小目标检测过程中的难点!实现涨点
【SAHI】即插即用| SAHI操作可有效解决小目标检测过程中的难点!实现涨点
476 1
|
8月前
|
机器学习/深度学习 网络架构 计算机视觉
YOLOv5改进 | 主干篇 | 12月最新成果UniRepLknet特征提取网络(附对比试验效果图)
YOLOv5改进 | 主干篇 | 12月最新成果UniRepLknet特征提取网络(附对比试验效果图)
285 0
YOLOv5改进 | 主干篇 | 12月最新成果UniRepLknet特征提取网络(附对比试验效果图)
|
8月前
|
机器学习/深度学习 存储 算法
YOLO落地部署 | 一文全览YOLOv5最新的剪枝、量化的进展【必读】
YOLO落地部署 | 一文全览YOLOv5最新的剪枝、量化的进展【必读】
1118 0
|
8月前
|
机器学习/深度学习 网络架构 计算机视觉
YOLOv8改进 | 主干篇 | 12月最新成果UniRepLknet特征提取网络(附对比试验效果图)
YOLOv8改进 | 主干篇 | 12月最新成果UniRepLknet特征提取网络(附对比试验效果图)
388 0
|
8月前
|
机器学习/深度学习
YOLOv5改进 | 细节创新篇 | iAFF迭代注意力特征融合助力多目标细节涨点
YOLOv5改进 | 细节创新篇 | iAFF迭代注意力特征融合助力多目标细节涨点
226 0

热门文章

最新文章

下一篇
开通oss服务