DETR也需要学习 | DETR-Distill模型蒸馏让DETR系类模型持续发光发热!!!(二)

简介: DETR也需要学习 | DETR-Distill模型蒸馏让DETR系类模型持续发光发热!!!(二)

4、实验


4.1、消融实验

1、主要结果

2、分析渐进式蒸馏

image.png

3、分类和回归分支样本消融

image.png

4、特色分区规划策略分析

image.png

image.png

4.2、COCO

image.png

4.3、Distilling to Lightweight Backbones

image.png

4.4、Self-Distillation


5、参考


[1].DETRDistill: A Universal Knowledge Distillation Framework for DETR-families.


6、推荐阅读


目标检测系列 | 无NMS的端到端目标检测模型,超越OneNet,FCOS等SOTA!

目标检测落地技能 | 拥挤目标检测你是如何解决的呢?改进Copy-Paste解决拥挤问题!

多目标跟踪新SOTA | TransTrack改进版本来啦,模型减小58.73%,复杂性降低78.72%

目录
打赏
0
0
0
0
34
分享
相关文章
NeurIPS Spotlight:从分类到生成:无训练的可控扩散生成
无训练的可控扩散生成是一种新颖的生成模型方法,无需额外训练即可利用已有无条件扩散模型和目标属性预测器生成具有特定属性的样本。相比传统模型,它减少了计算成本,提升了可控性和灵活性,适用于图像、文本等领域。然而,该方法也面临预测器质量、算法鲁棒性和数据多样性等挑战。此研究在NeurIPS会议上获Spotlight关注,论文链接:https://arxiv.org/abs/2409.15761。
32 15
NeurIPS 2024最佳论文,扩散模型的创新替代:基于多尺度预测的视觉自回归架构
本文详细解读NeurIPS 2024最佳论文《视觉自回归建模:基于下一尺度预测的可扩展图像生成》。该研究提出VAR模型,通过多尺度token图和VAR Transformer结构,实现高效、高质量的图像生成,解决了传统自回归模型在二维结构信息、泛化能力和计算效率上的局限。实验表明,VAR在图像质量和速度上超越现有扩散模型,并展示出良好的扩展性和零样本泛化能力。未来研究将聚焦于文本引导生成和视频生成等方向。
459 8
NeurIPS 2024最佳论文,扩散模型的创新替代:基于多尺度预测的视觉自回归架构
LeCun 的世界模型初步实现!基于预训练视觉特征,看一眼任务就能零样本规划
纽约大学Gaoyue Zhou等人提出DINO World Model(DINO-WM),利用预训练视觉特征构建世界模型,实现零样本规划。该方法具备离线训练、测试时行为优化和任务无关性三大特性,通过预测未来补丁特征学习离线行为轨迹。实验表明,DINO-WM在迷宫导航、桌面推动等任务中表现出强大的泛化能力,无需依赖专家演示或奖励建模。论文地址:https://arxiv.org/pdf/2411.04983v1。
108 21
YOLOv8改进 | 2023主干篇 | RepViT从视觉变换器(ViT)的视角重新审视CNN
YOLOv8改进 | 2023主干篇 | RepViT从视觉变换器(ViT)的视角重新审视CNN
505 1
YOLOv8改进 | 2023主干篇 | RepViT从视觉变换器(ViT)的视角重新审视CNN
YOLOv5改进 | 2023主干篇 | RepViT从视觉变换器(ViT)的视角重新审视CNN
YOLOv5改进 | 2023主干篇 | RepViT从视觉变换器(ViT)的视角重新审视CNN
410 0
CVPR 2023|两行代码高效缓解视觉Transformer过拟合,美图&国科大联合提出正则化方法DropKey
CVPR 2023|两行代码高效缓解视觉Transformer过拟合,美图&国科大联合提出正则化方法DropKey
319 0

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等