必备技能 | YOLOv6中的用Channel-wise Distillation进行的量化感知训练来自哪里?(二)

简介: 必备技能 | YOLOv6中的用Channel-wise Distillation进行的量化感知训练来自哪里?(二)

4、实验


4.1、消融实验

1、通道蒸馏的有效性

归一化通道的概率图和不对称 KL 差异在蒸馏方法中起重要作用。这里使用4种不同变体进行实验,以显示表4中提出的方法的有效性。所有蒸馏方法都应用于与输入相同的作用图。

  • “PI”代表像素级知识蒸馏,该蒸馏使每个空间位置的激活归一化。
  • “L2 W/O NORM”表示直接最大程度地减少了来自两个网络的特征图之间的差异,这两个网络都考虑了所有通道中所有位置的差异。
  • “Bhat”是Bhattacharyya距离,这是对称分布测量。它与每个通道中的差异对齐。

从表4中可以看到测量归一化通道差异的不对称 KL 差异可实现最佳性能。请注意,由于 KL 差异是不对称的,因此无法互换学生和老师的意见。通过更改 KL 差异中输入的顺序进行实验,并且训练不会收敛。

2、温度参数和损失权重的影响

通过在不同的损失权重α下调整温度参数t来进行实验以改变通道概率图。实验是在逻辑图上进行的。结果如图3所示。所有结果都是三次的平均值。损失权重设置为1、2、3和t∈[1、5]。如果增加T,则分布往往会Soft。

从图中可以看到,一个Softer的概率图可能有助于知识的蒸馏。此外,在一定的范围内,性能是稳定的。如果T设置为较小,性能似乎会下降。在这种情况下,该方法只关注有限的显著像素。当T = 4和α = 3在PSPNet18上获得了最好的性能。

4.2、SOTA对比

1、语义分割

2、目标检测


5、参考


[1].Channel-wise Knowledge Distillation for Dense Prediction*.


推荐阅读


All are Worth Words | 当 ViT 遇到扩展模型会出现什么样子的火花?Light-YOLOv5 | SepViT + BiFPN + SIoU成就更轻更快更优秀的 YOLOv5 改进算法

连夜卷出 | 超越所有YOLO检测模型,mmdet开源当今最强最快目标检测模型!

相关文章
|
5月前
|
机器学习/深度学习
DNN模型训练
【8月更文挑战第9天】DNN模型训练。
37 1
|
机器学习/深度学习 存储 缓存
YOLOv5的Tricks | 【Trick9】模型剪枝处理与Pytorch实现的剪枝策略
在yolov5项目中的torch_utils.py文件下,有prune这个函数,用来实现模型的剪枝处理。对模型裁剪,模型剪枝这方面之前没有接触到,这里用这篇笔记来学习记录一下这方面内容。
2286 0
YOLOv5的Tricks | 【Trick9】模型剪枝处理与Pytorch实现的剪枝策略
|
机器学习/深度学习 编解码 自然语言处理
EfficientNet、ShuffleNet、NFNet…你都掌握了吗?一文总结图像分类必备经典模型(三)
EfficientNet、ShuffleNet、NFNet…你都掌握了吗?一文总结图像分类必备经典模型(三)
216 0
EfficientNet、ShuffleNet、NFNet…你都掌握了吗?一文总结图像分类必备经典模型(三)
|
计算机视觉 索引
必备技能 | YOLOv6中的用Channel-wise Distillation进行的量化感知训练来自哪里?(一)
必备技能 | YOLOv6中的用Channel-wise Distillation进行的量化感知训练来自哪里?(一)
286 0
|
计算机视觉
目标检测无痛涨点新方法 | DRKD蒸馏让ResNet18拥有ResNet50的精度(二)
目标检测无痛涨点新方法 | DRKD蒸馏让ResNet18拥有ResNet50的精度(二)
156 0
|
机器学习/深度学习 计算机视觉 索引
目标检测无痛涨点新方法 | DRKD蒸馏让ResNet18拥有ResNet50的精度(一)
目标检测无痛涨点新方法 | DRKD蒸馏让ResNet18拥有ResNet50的精度(一)
583 0
|
机器学习/深度学习 编解码 人工智能
EfficientNet、ShuffleNet、NFNet…你都掌握了吗?一文总结图像分类必备经典模型(五)
EfficientNet、ShuffleNet、NFNet…你都掌握了吗?一文总结图像分类必备经典模型
712 0
|
机器学习/深度学习 人工智能 算法
【Pytorch神经网络理论篇】 31 图片分类模型:ResNet模型+DenseNet模型+EffcientNet模型
在深度学习领域中,模型越深意味着拟合能力越强,出现过拟合问题是正常的,训练误差越来越大却是不正常的。
400 0
|
缓存 算法 PyTorch
YOLOv5的Tricks | 【Trick12】YOLOv5使用的数据增强方法汇总
YOLOv5的Tricks | 【Trick12】YOLOv5使用的数据增强方法汇总
3242 0
YOLOv5的Tricks | 【Trick12】YOLOv5使用的数据增强方法汇总
|
算法 计算机视觉 索引
必备技能 | YOLOv6中的用Channel-wise Distillation进行的量化感知训练来自哪里?
必备技能 | YOLOv6中的用Channel-wise Distillation进行的量化感知训练来自哪里?
697 0
必备技能 | YOLOv6中的用Channel-wise Distillation进行的量化感知训练来自哪里?