ARM-CPU150FPS | PicoDet助力移动端达到超实时检测(强烈建议工程人员学习)(二)

简介: ARM-CPU150FPS | PicoDet助力移动端达到超实时检测(强烈建议工程人员学习)(二)

4实验


4.1 SOTA结果对比

image.png

4.2 消融实验

image.png

1、CSP-PAN

首先得到与NanoDet相似的Base模型,Backbone采用ShuffleNetV2-1x ,Neck采用无卷积的PAN,Loss采用标准GFL Loss,标签分配策略采用ATSS。所有激活函数都使用LeakyRelu。得到的mAP(0.5:0.95)是25.3。

进一步,采用了CSP-PAN结构。特征图比例尺为3。(0.5:0.95)增加到28.1。最后,我们在CSP-PAN的顶部添加了一个特征scale。就像CSP-PAN的最终结构一样,参数的数量增加了不到50K。mAP(0.5:0.95)被进一步改进到29.1。

2、Loss

在前一节中,在相同配置下比较了Varifocal Loss (VFL)和Quality Focal Loss  (QFL)的影响。两者的影响是相近的,Varifocal Loss仅略好于Quality Focal Loss。将QFL替换为VFL, mAP(0.5:0.95)从29.1提高到29.2。

3、Label Assignment Strategy

在前一节的相同配置下,用原始的SimOTA和修改的SimOTA替换ATSS。发现n越大效果越差。然后将参数n设置为10。ATSS的性能与原SimOTA几乎相同。修改的mAP (0.5:0.95) SimOTA达到30.0。

4、ESNet Backbone

image.png

5、H-Swish激活函数

最后,替换所有LeakyRelu为H-Swish激活函数,mAP(0.5:0.95)最终增加到30.6。

6、检测结果可视化

                                                      img


5参考


[1].PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices

相关文章
|
4月前
|
存储 缓存 Linux
关于S3学习所涉及到的知识(一):per-CPU变量&kernel syscore
关于S3学习所涉及到的知识(一):per-CPU变量&kernel syscore
34 0
|
4月前
|
C语言
start.S详解学习(一):设置 CPU 模式
start.S详解学习(一):设置 CPU 模式
38 0
|
10月前
|
缓存
【软考学习4】计算机构成——CPU 结构、Flynn 分类法、CISC和RISC
【软考学习4】计算机构成——CPU 结构、Flynn 分类法、CISC和RISC
143 0
|
12月前
|
机器学习/深度学习 存储 固态存储
ARM-CPU150FPS | PicoDet助力移动端达到超实时检测(强烈建议工程人员学习)(一)
ARM-CPU150FPS | PicoDet助力移动端达到超实时检测(强烈建议工程人员学习)(一)
130 0
|
12月前
|
芯片 开发者
玄铁RISC-V处理器入门与实战-平头哥玄铁CPU IP-玄铁CPU课程学习
玄铁RISC-V处理器入门与实战-平头哥玄铁CPU IP-
153 0
|
存储 缓存 架构师
程序员学习 CPU 有什么用?
在上一篇文章里,我们聊到了计算机的冯·诺依曼架构,以及计算机的五大部件:控制器、运算器、存储器、输入设备和输出设备。在现在计算机体系中,CPU 是整个计算机的核心,主要包含控制器和运算器两大部件。 在后续文章中,我们将从 CPU 的基本认识开始,逐步将 CPU 与执行系统、存储系统和 I/O 系统串联起来,请关注。
127 0
学习目录-自己动手写CPU
学习目录-自己动手写CPU
50 0
|
存储 测试技术 虚拟化
《vSphere性能设计:性能密集场景下CPU、内存、存储及网络的最佳设计实践》一3.1.6 学习虚拟化
本节书摘来华章计算机《vSphere性能设计:性能密集场景下CPU、内存、存储及网络的最佳设计实践》一书中的第3章 ,第3.1.6节,[美] 克里斯托弗·库塞克(Christopher Kusek) 著 吕南德特·施皮斯(Rynardt Spies)姚海鹏 刘韵洁 译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1450 0