【论文速递】CVPR2022 - 检测器的局部和全局知识蒸馏

简介: 【论文速递】CVPR2022 - 检测器的局部和全局知识蒸馏

【论文速递】CVPR2022 - 检测器的局部和全局知识蒸馏

【论文原文】:Focal and Global Knowledge Distillation for Detectors

获取地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9879869

博主关键词: 目标检测,知识蒸馏,局部,全局

推荐相关论文:

-无

摘要:

知识蒸馏已成功应用于图像分类。然而,目标检测要复杂得多,大多数知识蒸馏方法都失败了。在本文中,我们指出,在目标检测中,教师和学生的特征在不同领域差异很大,尤其是在前景和背景方面。如果我们将它们平均蒸馏,特征图之间的不均匀差异将对蒸馏产生负面影响。因此,我们提出了局部和全局蒸馏(FGD)。局部蒸馏将前景和背景分开,迫使学生专注于教师的关键像素和通道。全局蒸馏重建不同像素之间的关系,并将其从教师转移到学生,补偿局部蒸馏中缺失的全局信息。由于我们的方法只需要计算特征图上的损耗,FGD可以应用于各种探测器。我们在具有不同骨干的各种探测器上进行实验,结果表明学生检测器实现了出色的mAP改进。例如,基于ResNet-50的RetinaNet,Faster RCNN,RepPoints和Mask RCNN采用我们的蒸馏方法在COCO40上实现了7.42%,0.42%,0.42%和1.2017%的mAP,分别比基线高3.3,3.6,3.4和2.9。我们的代码可在 https://github.com/yzd-v/FGD 获得。

关键词 :目标检测,知识蒸馏,局部,全局。

简介:

最近,深度学习在各个领域取得了巨大的成功[8],[9],[22],[24]。为了获得更好的性能,我们通常使用更大的主干,这需要更多的计算资源和更慢的推理。为了克服这个问题,已经提出了知识蒸馏[11]。知识蒸馏是一种将信息从大型教师网络继承到紧凑的学生网络并在推理期间无需额外成本即可实现强大性能的方法。然而,大多数蒸馏方法[10],[27],[33],[34]是为图像分类而设计的,这导致了物体检测的微不足道的改进。

d9a90d2048604bb7751c9171de8ccb6.png

Fig. 1. Visualization of the spatial and channel attention map from the teacher detector (RetinaNet-ResNeXt101) and the student detector (RetinaNet-ResNet50).

Table. 1. Comparisons of different distillation areas. fg: foreground. bg: background. split: split the foreground and background and distill them with different weights.

ee6cfc339e21255ad79e5ae0b494056.png


众所周知,极端的前景-背景类不平衡是目标检测的关键点[17]。不平衡的比例也会损害物体检测的蒸馏。对于这个问题,有一些努力。陈等.[3] 分配权重以抑制背景。Mimick [15] 提炼了学生的区域提案网络提出的积极区域。FGFI [28] 和 TADF [25] 分别使用细粒度和高斯掩膜来选择蒸馏区域。Defeat[7] 分别提炼前景和背景。然而,蒸馏的关键区域在哪里尚不清楚。

为了探索学生和教师特征之间的差异,我们对空间和通道注意力进行了可视化。如图 1 所示,学生的注意力和教师的注意力在前景中的注意力差异相当显著,而在背景中的差异相对较小。这可能会导致学习前景和背景的不同困难。在本文中,我们进一步探讨了知识蒸馏中的前景和背景对目标检测的影响。我们通过分离蒸馏中的前景和背景来设计实验。令人惊讶的是,如表 1 所示,前景和背景一起蒸馏的性能最差,甚至比仅使用前景或背景还要糟糕。这种现象表明,特征图中的不均匀差异会对蒸馏产生负面影响。此外,如图 1 所示,每个通道之间的注意力也有很大不同。再深入思考,不仅前景和背景之间存在负面影响,而且像素和通道之间也存在负面影响。因此,我们建议进行局部蒸馏。在分离前景和背景的同时,局部蒸馏还计算了教师特征中不同像素和通道的注意力,让学生专注于教师的关键像素和通道。

然而,仅仅关注关键信息是不够的。众所周知,全局环境在检测中也起着重要作用。许多关系模块已成功应用于检测,如非局部[29]、GcBlock [2]、关系网络[12],大大提高了探测器的性能。为了弥补局部蒸馏中缺失的全局信息,我们进一步提出了全局蒸馏。在全局蒸馏中,我们利用GcBlock提取不同像素之间的关系,然后从教师到学生进行提取。

正如我们上面分析的,我们提出了局部和全局蒸馏(FGD),结合局部蒸馏和全局蒸馏,如图2所示。所有损失函数仅根据特征计算,因此FGD可以直接用于各种探测器,包括两级模型,基于锚的单级模型和无锚的单级模型。没有花里胡哨的东西,我们使用FGD在物体检测方面实现了最先进的性能。简而言之,本文的贡献是:

  • 我们提出,教师和学生关注的像素和通道是完全不同的。如果我们在不区分像素和通道的情况下提炼它们,这将导致微不足道的改进。
  • 我们提出局部和全局蒸馏,使学生不仅可以关注教师的关键像素和通道,还可以学习像素之间的关系。
  • 我们通过对COCO [18]的广泛实验来验证我们的方法在各种探测器上的有效性,包括单级,两级,无锚方法,实现了最先进的性能。
目录
相关文章
阿萨聊测试:如何用Postman查看HTTP消息相关内容?
阿萨聊测试:如何用Postman查看HTTP消息相关内容?
580 0
阿萨聊测试:如何用Postman查看HTTP消息相关内容?
|
小程序 JavaScript 关系型数据库
微信小程序远程连接阿里云服务器mysql——我与阿里云的相遇
第一次接触阿里云服务器:用小程序通过nodejs连接远程服务器
2259 0
微信小程序远程连接阿里云服务器mysql——我与阿里云的相遇
|
存储 物联网 网络性能优化
|
5月前
|
敏捷开发 监控 数据可视化
提升开发团队效率:2025年最受欢迎的IT开发进度工具选型推荐
在科技快速发展的背景下,高效管理软件开发进度成为团队成功的关键。本文深入解析IT开发进度工具的核心原理,结合7款主流工具的功能与适用场景,为不同规模的开发团队提供科学选型建议,助力提升项目管理效率和团队协作水平。
|
人工智能 分布式计算 大数据
超级计算与大数据:推动科学研究的发展
【9月更文挑战第30天】在信息时代,超级计算和大数据技术正成为推动科学研究的关键力量。超级计算凭借强大的计算能力,在尖端科研、国防军工等领域发挥重要作用;大数据技术则提供高效的数据处理工具,促进跨学科合作与创新。两者融合不仅提升了数据处理效率,还推动了人工智能、生物科学等领域的快速发展。未来,随着技术进步和跨学科合作的加深,超级计算与大数据将在科学研究中扮演更加重要的角色。
|
11月前
|
算法 C语言
【C语言程序设计——函数】利用函数求解最大公约数和最小公倍数(头歌实践教学平台习题)【合集】
本文档介绍了如何编写两个子函数,分别求任意两个整数的最大公约数和最小公倍数。内容涵盖循环控制与跳转语句的使用、最大公约数的求法(包括辗转相除法和更相减损术),以及基于最大公约数求最小公倍数的方法。通过示例代码和测试说明,帮助读者理解和实现相关算法。最终提供了完整的通关代码及测试结果,确保编程任务的成功完成。
588 15
【C语言程序设计——函数】利用函数求解最大公约数和最小公倍数(头歌实践教学平台习题)【合集】
|
存储 自然语言处理 安全
C++ STL标准库 《string原理与实战分析》
C++ STL标准库 《string原理与实战分析》
345 0
|
安全 算法 Linux
Linux 服务器还有漏洞?建议使用 OpenVAS 日常检查!
在数字化时代,Linux 服务器的安全至关重要。OpenVAS 是一款优秀的开源漏洞扫描工具,可以帮助及时发现并修复服务器中的安全隐患。本文将介绍 OpenVAS 的主要功能、使用方法及应对漏洞的措施,帮助用户加强服务器安全管理,确保企业数字化安全。
424 7
|
人工智能 搜索推荐 算法
技术与人性:在数字时代探索人文关怀####
身处技术日新月异的今天,我们享受着科技带来的便捷,却也面临着前所未有的挑战——如何在冰冷的代码与算法中融入温暖的人性?本文旨在探讨技术背后的人文价值,通过剖析当前技术发展趋势,揭示技术进步对个体和社会的双重影响,并提出构建以人为本的技术发展观。不涉及具体技术细节,而是从更宏观的视角审视技术与人性的关系,强调在追求技术创新的同时,不应忽视对人类情感、伦理及社会责任的考量。 ####
|
存储 安全 数据库
双重防护,无懈可击!Python AES+RSA加密方案,构建最强数据安全堡垒
【9月更文挑战第11天】在数字时代,数据安全至关重要。AES与RSA加密技术相结合,构成了一道坚固防线。AES以其高效性保障数据加密,而RSA则确保密钥安全传输,二者相辅相成,提供双重保护。本文通过Python代码示例展示了这一加密方案的魅力,强调了其在实际应用中的重要性和安全性。使用HTTPS等安全协议传输加密密钥和密文,确保数据在数字世界中自由流通而无忧。
433 1