4实验
4.1 消融实验
1、Central region exploration
如表7第3行所示,将AP提高了2.3%(从37.6%到39.9%)。然而,小目标的改进(4.6%)比其他对象尺度更显著。对于大目标的改进几乎可以忽略不计(从52.2%到52.3%)。这并不奇怪,因为不正确的小边界框的数量更大,它们通常不包含对象的中心关键点,这更有可能受益于通过中心关键点过滤。
2、Center pooling
表7中的第4行显示了Center pooling
通过以下方式改进AP0.9%(由39.9%至40.8%)。值得注意的是,在Center pooling
的帮助下,将大目标的AP提高了1.4%(52.2%到53.6%),这远远高于使用传统卷积的改进(即1.4% vs. 0.1%)。
结果表明,Center pooling
能够有效地检测出对象的中心关键点,特别是大目标。因为Center pooling
可以提取更丰富的内部视觉模式,更大目标包含更容易访问的内部视觉模式。
图7(e)
图7(e)显示了在没有/使用Center pooling
的情况下检测中心关键点的结果。可以看到,传统的卷积方法无法定位到奶牛的中心关键点,但是通过Center pooling
,可以成功定位到中心关键点。
3、Cascade corner pooling
表7中的第二行显示了在CornerNet511-52基础上测试的结果。Cascade corner pooling
使AP提高了0.7%(从37.6%提高到38.3%)。最后一行是基于CenterNet511-52进行测试的结果,它使AP提高了0.5%(从40.8%提高到41.3%)。
第二行的结果显示,大目标的AP几乎没有变化(即,52.2% vs. 52.2%),但AR提高了1.8%(从74.0%到75.8%)。这表明,Cascade corner pooling
有助于在大目标中获得更多的内部视觉模式,但过于丰富的视觉模式可能会干扰其对边界信息的感知,导致许多不准确的边界框。通过使用CenterNet,有效地抑制了不准确的bbox,使大目标的AP提高了2.2%(从53.6%提高到55.8%)。
图7(f)
图7(f)显示了采用角池或Cascade corner pooling
检测角的结果。可以看到,Cascade corner pooling
可以成功定位左侧猫的一对角,而Corner pooling
则不能。
4.2 多分辨率检测提高了精度
如表3所示,本文提出的MR-CenterNet进一步提高了目标检测精度。例如,在相同的网络深度(Hourglass-52 vs. ResNet-50)下,MR-CenterNet将目标的AP提高了4.8%。由于MR-CenterNet框架的通用性强,能够为CenterNet应用更强的Backbone。
表4显示了2次实验在MS COCO验证数据集上的检测结果,MR-CenterNet具有多分辨率检测层,准确率更高。这是因为多分辨率检测结构为检测不同尺度的目标提供了更丰富的感受野,有助于提高检测精度。
4.3 实时目标检测
如表5所示。CenterNet-RT实现了精度和速度之间的良好平衡,在其他典型方法中仍然具有竞争力。CenterNet(即SR-CenterNet)执行速度较慢,推断速度小于7fps。本文采用金字塔结构的CenterNet对目标进行多分辨率特征层检测,提高了检测速度和精度。
使用ResNet-50,MR-CenterNet在14.5 FPS下实现45.7% AP。进一步在MR-CenterNet的基础上提出了CenterNet-RT,实现了在30.5FPS下43.2% AP的结果。这种准确性与SR-CenterNet(HG-104)不相上下,但推理速度比SR-CenterNet快约6倍。
4.5 SOTA对比
5参考
[1].CenterNet++ for Object Detection
6推荐阅读
YOLOv5永不缺席 | YOLO-Pose带来实时性高且易部署的姿态估计模型!!!