解析YOLOv7四大核心创新点网络结构与标签分配-开发者社区-阿里云

yolov7论文学习——创新点解析、网络结构图

2024-04-15 998

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： yolov7论文学习——创新点解析、网络结构图

创新点

1、提出了E-ELAN，但是只在yolov7-e6e中使用到。
2、yolov7基于拼接模型的缩放方法，在yolov7x中使用到。
3、将重参数化卷积应用到残差模块中或者用到基于拼接的模块中去。RepConvN
4、提出了两种新的标签分配方法

一、ELAN和E-ELAN

1、 ELAN

yolov7使用大量的ELAN作为基础模块。这么多堆叠其实对应了更密集的残差结构，残差网络的特点是容易优化，并且能够通过增加相当的深度来提高准确率。内部的残差块使用了跳跃连接，缓解了在深度神经网络中增加深度带来的梯度消失问题。

[-1, 1, Conv, [64, 1, 1]],
   [-2, 1, Conv, [64, 1, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [[-1, -3, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [256, 1, 1]],  # 11

2、E-ELAN

2分组的卷积，本质上就是ELAN的拓展。只在yolov7-e6e中提到，是将yolov7-e6中的ELAN并行处理后得到的。

二、模型缩放

设计了同时改变深度和宽度的模型缩放方法，yolov7x是对yolov7进行了缩放。

增加了两个卷积层，增加了深度，并且输入数量，拼接后输出数量，以及卷积层输出的通道数量都是原来的1.25倍，从这个角度考虑增加了宽度。

三、重参数化卷积的改进 RepConvN

1、RepConv

重参数化卷积，使用3个不同的卷积层训练完成后，进行合并。重参数化卷积虽然在VGG上取得较好的成果，但是在残差网络中并没有取得很好的成果。

2、RepConvN

而RepConvN是在重参数化卷积的基础上去掉了恒等连接。将重参数化卷积应用到残差模块或者用到基于拼接的模块中去。但是在代码中使用了最简单的重参数化卷积，并没有使用提出的这个结论。

思想取自于RepVGG，基本思想是在训练的时候引入特殊的残差结构辅助训练，这个残差结构是经过独特设计的，在实际预测的时候，可以将复杂的残差结构等效于一个普通的3*3卷积，这个时候网络的复杂度下降，但是网络的预测性能却没有下降。

为什么要去掉恒等连接？

因为残差网络本身存在恒等连接，而原本的重参数化卷积RepConv也有恒等连接，两者之间起了冲突，所以要去掉原本重参数化卷积RepConv中的恒等连接，成为RepConvN。

四、软标签和硬标签

硬标签是yolov5所采用的方式，将目标值和预测值一起计算损失值；软标签是yolov7所使用的方式，将目标值通过分配器得到新的目标值，再和预测值一起计算损失值。

五、两种新的标签分配方法

粗粒度和细粒度。粗标签是5个网格，细标签是3个网格。

yolov7论文学习——创新点解析、网络结构图