RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型(3)

简介: RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型

5、 ObjectBox

本文提出了 ObjectBox,一种one-stage Anchor-free且高度通用的目标检测方法。与现有的Anchor-based和Anchor-free的检测器相比,原有方法在标签分配中更偏向于特定的目标尺度,ObjectBox仅使用目标中心位置作为正样本,并在不同的特征级别平等对待所有目标,而不管物体的大小或形状。具体来说,ObjectBox的标签分配策略以Anchor-free的方式将目标中心位置视为与形状和大小无关的Anchor,并允许在每个目标的所有尺度上进行学习。为了支持这一点,作者将新的回归目标定义为从中心单元位置的2个角到边界框4个边的距离。此外,为了处理尺度变化的目标,作者提出了一种定制的 IoU 损失来处理不同大小的框。因此,本文提出的目标检测器不需要跨数据集调整任何依赖于数据集的超参数。

图11. ObjectBox计算中心单元的两个角到bounding box的距离。一个大物体和小物体分别显示在(a)和(b)中。在(b)中,小物体完全位于一个单元格内,这通常发生在较大的步长中(例如,s_i=32)。然而,ObjectBox并没有抛弃这些情况,因为它对所有具有不同尺度的物体都回归到边界框的四边

如上图, 对应于尺度 i的回归目标如下:

网络的预测值定义如下,

与YOLO、FCOS相比, ObjectBox 将所有尺度的所有目标框都视为正样本。因此,无论目标大小如何,它都从所有尺度中学习,以从多个级别实现更可靠的回归。

本文感兴趣的是最小化两个box之间的距离,这两个box分别由四个距离值给出。由于我们对具有不同尺寸的物体从不同的尺度进行学习(不区分尺度等级),bounding box回归损失函数应该是尺度不变的。SDIoU 考虑非重叠区域、重叠或交叉区域以及覆盖这2个框的最小框。其中:

通过计算交叉区域对角线长度的平方来获得交叉区域 I:

覆盖预测框和真实框的最小面积C,由其长度的平方计算为:


通过最小化C,预测框可以在4个方向向真实框移动, 因此将SDIoU定义为:


其中,ρ表示一个有利于重叠区的正的权衡值(在文中所有的实验中都设定ρ=1)。作者在分子中同时使用I和(-S)来对交叉区域进行评分,同时对非重叠区域进行惩罚。因此,预测的4个距离值被强制要求与ground-truth距离更快匹配。SDIoU的损失最终被定义为LIoU = 1 - IoU。图12展示了SDIoU损失中所考虑的区域。


图12. box regression的SDIoU损失区域

当前 SOTA!平台收录 ObjectBox 共 1 个模型实现资源。


项目 SOTA!平台项目详情页
ObjectBox 前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/project/objectbox


前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及API等资源。

网页端访问:在浏览器地址栏输入新版站点地址 sota.jiqizhixin.com ,即可前往「SOTA!模型」平台,查看关注的模型是否有新资源收录。

移动端访问:在微信移动端中搜索服务号名称「机器之心SOTA模型」或 ID 「sotaai」,关注 SOTA!模型服务号,即可通过服务号底部菜单栏使用平台功能,更有最新AI技术、开发资源及社区动态定期推送。

相关文章
|
3月前
|
机器学习/深度学习 Oracle 固态存储
目标检测涨点小Trick | 回顾Proposal-Based目标检测,启发小改NMS即可带来涨点
目标检测涨点小Trick | 回顾Proposal-Based目标检测,启发小改NMS即可带来涨点
45 1
|
3月前
|
数据可视化 计算机视觉 C++
CVPR 2023 | 即插即用!SQR:对于训练DETR-family目标检测的探索和思考
CVPR 2023 | 即插即用!SQR:对于训练DETR-family目标检测的探索和思考
25 0
|
5月前
|
机器学习/深度学习 算法 固态存储
【计算机视觉】目标检测中Faster R-CNN、R-FCN、YOLO、SSD等算法的讲解(图文解释 超详细必看)
【计算机视觉】目标检测中Faster R-CNN、R-FCN、YOLO、SSD等算法的讲解(图文解释 超详细必看)
131 0
|
机器学习/深度学习 算法 数据挖掘
二阶段目标检测网络-Faster RCNN 详解
二阶段目标检测网络-Faster RCNN 详解
310 0
|
12月前
|
机器学习/深度学习 编解码 固态存储
RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型(2)
RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型
151 0
|
12月前
|
机器学习/深度学习 编解码 固态存储
RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型(1)
RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型
|
12月前
|
机器学习/深度学习 人工智能 算法
目标检测:RPN — Faster R-CNN 的主干
目标检测:RPN — Faster R-CNN 的主干
144 0
|
12月前
|
编解码 计算机视觉
3D检测新SOTA | PointPillar与Faster RCNN结合会碰撞出怎样的火花(二)
3D检测新SOTA | PointPillar与Faster RCNN结合会碰撞出怎样的火花(二)
174 0
|
12月前
|
存储 编解码 自动驾驶
3D检测新SOTA | PointPillar与Faster RCNN结合会碰撞出怎样的火花(一)
3D检测新SOTA | PointPillar与Faster RCNN结合会碰撞出怎样的火花(一)
97 0
|
12月前
|
机器学习/深度学习 自动驾驶 大数据
3D检测涨点Trick | 2D检测居然可以教BEV进行3D目标检测
3D检测涨点Trick | 2D检测居然可以教BEV进行3D目标检测
426 0

相关实验场景

更多