5、 ObjectBox
本文提出了 ObjectBox,一种one-stage Anchor-free且高度通用的目标检测方法。与现有的Anchor-based和Anchor-free的检测器相比,原有方法在标签分配中更偏向于特定的目标尺度,ObjectBox仅使用目标中心位置作为正样本,并在不同的特征级别平等对待所有目标,而不管物体的大小或形状。具体来说,ObjectBox的标签分配策略以Anchor-free的方式将目标中心位置视为与形状和大小无关的Anchor,并允许在每个目标的所有尺度上进行学习。为了支持这一点,作者将新的回归目标定义为从中心单元位置的2个角到边界框4个边的距离。此外,为了处理尺度变化的目标,作者提出了一种定制的 IoU 损失来处理不同大小的框。因此,本文提出的目标检测器不需要跨数据集调整任何依赖于数据集的超参数。
图11. ObjectBox计算中心单元的两个角到bounding box的距离。一个大物体和小物体分别显示在(a)和(b)中。在(b)中,小物体完全位于一个单元格内,这通常发生在较大的步长中(例如,s_i=32)。然而,ObjectBox并没有抛弃这些情况,因为它对所有具有不同尺度的物体都回归到边界框的四边
如上图, 对应于尺度 i的回归目标如下:
网络的预测值定义如下,
与YOLO、FCOS相比, ObjectBox 将所有尺度的所有目标框都视为正样本。因此,无论目标大小如何,它都从所有尺度中学习,以从多个级别实现更可靠的回归。
本文感兴趣的是最小化两个box之间的距离,这两个box分别由四个距离值给出。由于我们对具有不同尺寸的物体从不同的尺度进行学习(不区分尺度等级),bounding box回归损失函数应该是尺度不变的。SDIoU 考虑非重叠区域、重叠或交叉区域以及覆盖这2个框的最小框。其中:
通过计算交叉区域对角线长度的平方来获得交叉区域 I:
覆盖预测框和真实框的最小面积C,由其长度的平方计算为:
通过最小化C,预测框可以在4个方向向真实框移动, 因此将SDIoU定义为:
其中,ρ表示一个有利于重叠区的正的权衡值(在文中所有的实验中都设定ρ=1)。作者在分子中同时使用I和(-S)来对交叉区域进行评分,同时对非重叠区域进行惩罚。因此,预测的4个距离值被强制要求与ground-truth距离更快匹配。SDIoU的损失最终被定义为LIoU = 1 - IoU。图12展示了SDIoU损失中所考虑的区域。
图12. box regression的SDIoU损失区域
当前 SOTA!平台收录 ObjectBox 共 1 个模型实现资源。
项目 | SOTA!平台项目详情页 |
ObjectBox | 前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/project/objectbox |
前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及API等资源。
网页端访问:在浏览器地址栏输入新版站点地址 sota.jiqizhixin.com ,即可前往「SOTA!模型」平台,查看关注的模型是否有新资源收录。
移动端访问:在微信移动端中搜索服务号名称「机器之心SOTA模型」或 ID 「sotaai」,关注 SOTA!模型服务号,即可通过服务号底部菜单栏使用平台功能,更有最新AI技术、开发资源及社区动态定期推送。