即插即用 | CEASA模块给你所有,小目标精度提升的同时速度也变快了(二)

简介: 即插即用 | CEASA模块给你所有,小目标精度提升的同时速度也变快了(二)

3、实验


3.1、消融实验

1、在CESC和AMM上

image.png

如表2所示,通过使用CESC组件,基础检测器节省了约70%的GFLOPs,运行速度快1.43倍,而精度没有任何下降,因为SC降低了复杂性,CE-GN层和残差结构补偿了上下文的损失。

通过采用动态掩模比获得紧凑的前景覆盖,AMM组件进一步提高了精度,提高了11.9%,同时节省了5.1%的GFLOPs。

需要注意的是,当直接应用没有CESC的SC时,GFL V1的训练过程变得非常不稳定,因此没有通过单独评估GFL V1上的AMM来提供结果。

2、关于在CESC中的详细设计

image.png

作者分别评估了残差结构,CE-GN和等式中的归一化损失关于CESC的性能。直接将SC应用于GFL V1会使训练过程不稳定。如表3所示,当使用残差结构时,带有SC的GFL V1变得稳定,需要的gflop要少得多,但由于上下文的丢失,mAP急剧下降。通过CE-GN添加上下文信息,GFLOPs略有增加,从而显著提高了准确性。进一步提高了准确性和效率,因为它隐式地加强了特征的稀疏性。

image.png

进一步评估了CE-GN的性能,并将其与未使用归一化的方法进行了比较,如QueryDet、GN、动态头,BN和IN。还报告了原始GFL V1的结果,表示为“Dense Conv.”。

如表4所示,CE-GN在未归一化的情况下显著提高了2.6%。与其他归一化方案相比,CE-GN的精度最好,分别比GN、BN和IN高出0.7%、2.6%和0.8%。值得注意的是,CE-GN在GFLOPs和FPS方面的效率也最好。

image.png

为了突出CE-GN的优点,我们将密集卷积和稀疏卷积产生的特征之间的余弦相似性可视化,其中CE-GN和GN分别对SC进行归一化。如图3所示,使用CE-GN的特征比使用GN的特征表现出更高的相关性,这表明CE-GN在增强SC的全局上下文方面的优越性。

image.png

为了对全局上下文进行编码,利用了point-wise卷积,并与现有的技术进行了比较,包括普通的3×3卷积、GhostModule,以及一些基于注意力的方法,如CBAM和Criss-Cross注意力。

如表5所示,point-wise卷积在检测精度上优于对应卷积。同时,在基于卷积的方法中,GFLOPs最低,在所有方法中FPS最高,明显显示了其在平衡精度和效率方面的优势。

3、关于AMM的详细分析

比较了AMM模块在VisDrone上的固定屏蔽比分别为0.50到0.95,在UAVDT上分别为0.50到0.975。如图5所示,在降低掩模比时,卷积中涉及的特征更多,导致计算成本更高,FPS更低。在此同时,可以看到检测精度对掩模比值很敏感,而掩模比值并没有随着比值的增加而持续提高。

此外,最优固定掩模比在不同的数据集上有所不同,例如VisDrone为0.9,UAVDT为0.95。相比之下,AMM自适应地确定了一个适当的掩模比,使基础检测器达到最佳的精度和最高的推理速度,证明了其必要性。

请注意,AMM以“逐层”的方式分别计算不同层的掩模比率。将其与“全局”版本进行了比较,后者估计了所有层的全局掩模比率。如表6所示,在mAP和FPS方面,“层级”方法明显优于“全局”方法。

原因在于,如图4所示,FPN不同层的最优掩模比不同,“层”方法比“全局”方法估计掩模比更准确,从而提高了精度和效率。

作者还在表7中评估了其在不同FPN层中的影响。通过较少的FPN层,GFLOPs和FPS得到了改进。放弃P6-P7的影响不大,因为它们的信息较少。去除P4会导致mAP的急剧下降,表明P4至关重要,这与可视化一致。

3.2、SOTA对比


4、参考


[1].Adaptive Sparse Convolutional Networks with Global Context Enhancement for Faster Object Detection on Drone Images.

[2].https://github.com/Cuogeihong/CEASC.

相关文章
|
2月前
静态时序分析:工艺库的特征化条件和工作条件
静态时序分析:工艺库的特征化条件和工作条件
25 0
|
2月前
|
算法
【MFAC】基于紧格式动态线性化的无模型自适应迭代学习控制
【MFAC】基于紧格式动态线性化的无模型自适应迭代学习控制
【MFAC】基于紧格式动态线性化的无模型自适应迭代学习控制
|
11月前
|
存储 传感器 数据可视化
嵌入式设计中对于只有两种状态的变量存储设计,如何高效的对循迹小车进行偏差量化
嵌入式设计中对于只有两种状态的变量存储设计,如何高效的对循迹小车进行偏差量化
65 0
VHDL编写8-3线优先编码器
VHDL编写8-3线优先编码器
|
12月前
|
算法
使用HGS算法调整PD控制器增益的无人机动态性能数据——基于启发式的无人机路径跟踪优化(Matlab代码实现)
使用HGS算法调整PD控制器增益的无人机动态性能数据——基于启发式的无人机路径跟踪优化(Matlab代码实现)
使用HGS算法调整PD控制器增益的无人机动态性能数据——基于启发式的无人机路径跟踪优化(Matlab代码实现)
|
11月前
|
机器学习/深度学习 监控 搜索推荐
提升UMI分析精度和计算效率:Sentieon UMI分子标记处理模块
提升UMI分析精度和计算效率:Sentieon UMI分子标记处理模块
101 0
|
资源调度 运维 监控
启发式算法在监控软件中的用途
启发式算法在监控软件中的运用可以帮助解决复杂的优化和决策问题。与传统的精确算法相比,启发式算法更加适用于大规模、高维度和实时性要求较高的监控场景。
496 0
|
机器学习/深度学习 定位技术 计算机视觉
即插即用 | CEASA模块给你所有,小目标精度提升的同时速度也变快了(一)
即插即用 | CEASA模块给你所有,小目标精度提升的同时速度也变快了(一)
297 0
|
tengine 数据可视化 API
YOLOv5-Lite 树莓派实时 | 更少的参数、更高的精度、更快的检测速度(C++部署分享)(二)
YOLOv5-Lite 树莓派实时 | 更少的参数、更高的精度、更快的检测速度(C++部署分享)(二)
305 0
|
机器学习/深度学习 缓存 算法
YOLOv5-Lite 树莓派实时 | 更少的参数、更高的精度、更快的检测速度(C++部署分享)(一)
YOLOv5-Lite 树莓派实时 | 更少的参数、更高的精度、更快的检测速度(C++部署分享)(一)
327 0