详细解读 | Google与Waymo教你如何更好的训练目标检测模型！！！（附论文）（二）-阿里云开发者社区

详细解读 | Google与Waymo教你如何更好的训练目标检测模型！！！（附论文）（二）

2023-05-23 154

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 详细解读 | Google与Waymo教你如何更好的训练目标检测模型！！！（附论文）（二）

3检测框架

3.1 RetinaNet-RS

检测Head

遵循标准的RetinaNet head设计。简而言之，在最终的预测层之前使用4个3×3特征维数为256的卷积层和分类子网。每个卷积层之后是一个BN层和一个SiLU。

卷积层在检测头的所有特征层中共享，而BN层不共享。作者设置anchor的长宽比为[1.0;2.0;0.5]，并将基准anchor大小设置为3.0。focal loss参数α和γ分别设置为0.25和1.5。

特征提取

3.2 Cascade RCNN-RS

RPN Head

对于Cascade RCNN-RS，作者通常Cascade RCNN的实现。对于RPN head，作者在特征维数256处使用2个3×3卷积层，同时设计与RetinaNet相同的锚定框设置。作者用500个proposals进行训练，用1000个proposals进行推理。

Box回归Head

作者对box regression head使用2种设置，一种用于常规尺寸模型，另一种用于大尺寸模型。

对于常规尺寸的模型，作者实现了2个级联head，增加IoU阈值0.6和0.7。在最终的预测层之前，每个head在特征维度256处有4个3×3卷积层，在特征维度1024处有一个全连接层。

需要注意的是，为了获得良好的性能改进，必须使用与类无关的边界框回归。对于box regression head这里只预测了4个bounding box coordinates，而不是4个(类的数量)。

Instance segmentation head

在Instance segmentation head的最终预测层之前，作者在特征维度256处使用了4个3×3卷积层和1个3×3 stride=2反卷积层。

特征提取

作者首先使用常规大小的Cascade RCNN框架研究了ResNet-50/101/152/200模型族和EfficientNet B1到B7模型族的性能。

为了扩大基于ResNet的模型，作者使用表3中描述的缩放方法。扩大基于EfficientNet的模型。在ResNet和EfficientNet backbone上附加一个标准的FPN来提取P3到P7多尺度特征。

为了获得最好的性能，作者采用了SpineNet-143/143L backbone。SpineNet-143L backbone将SpineNet-143中所有卷积层的特征维度均匀地扩大了1.5倍。

4实验

4.1 速度与精度实验

4.2 输入分辨率的影响

4.3 后处理速度对比

4.4 SOTA实验

5参考

[1].Simple Training Strategies and Model Scaling for Object Detection

详细解读 | Google与Waymo教你如何更好的训练目标检测模型！！！（附论文）（二）

3检测框架

3.1 RetinaNet-RS

检测Head

特征提取

3.2 Cascade RCNN-RS

RPN Head

Box回归Head

Instance segmentation head

特征提取

4实验

4.1 速度与精度实验

4.2 输入分辨率的影响

4.3 后处理速度对比

4.4 SOTA实验

5参考

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

详细解读 | Google与Waymo教你如何更好的训练目标检测模型！！！（附论文）（二）

3检测框架

3.1 RetinaNet-RS

检测Head

特征提取

3.2 Cascade RCNN-RS

RPN Head

Box回归Head

Instance segmentation head

特征提取

4实验

4.1 速度与精度实验

4.2 输入分辨率的影响

4.3 后处理速度对比

4.4 SOTA实验

5参考

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像