RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型(3)

简介: RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型

5、 ObjectBox

本文提出了 ObjectBox,一种one-stage Anchor-free且高度通用的目标检测方法。与现有的Anchor-based和Anchor-free的检测器相比,原有方法在标签分配中更偏向于特定的目标尺度,ObjectBox仅使用目标中心位置作为正样本,并在不同的特征级别平等对待所有目标,而不管物体的大小或形状。具体来说,ObjectBox的标签分配策略以Anchor-free的方式将目标中心位置视为与形状和大小无关的Anchor,并允许在每个目标的所有尺度上进行学习。为了支持这一点,作者将新的回归目标定义为从中心单元位置的2个角到边界框4个边的距离。此外,为了处理尺度变化的目标,作者提出了一种定制的 IoU 损失来处理不同大小的框。因此,本文提出的目标检测器不需要跨数据集调整任何依赖于数据集的超参数。

图11. ObjectBox计算中心单元的两个角到bounding box的距离。一个大物体和小物体分别显示在(a)和(b)中。在(b)中,小物体完全位于一个单元格内,这通常发生在较大的步长中(例如,s_i=32)。然而,ObjectBox并没有抛弃这些情况,因为它对所有具有不同尺度的物体都回归到边界框的四边

如上图, 对应于尺度 i的回归目标如下:

网络的预测值定义如下,

与YOLO、FCOS相比, ObjectBox 将所有尺度的所有目标框都视为正样本。因此,无论目标大小如何,它都从所有尺度中学习,以从多个级别实现更可靠的回归。

本文感兴趣的是最小化两个box之间的距离,这两个box分别由四个距离值给出。由于我们对具有不同尺寸的物体从不同的尺度进行学习(不区分尺度等级),bounding box回归损失函数应该是尺度不变的。SDIoU 考虑非重叠区域、重叠或交叉区域以及覆盖这2个框的最小框。其中:

通过计算交叉区域对角线长度的平方来获得交叉区域 I:

覆盖预测框和真实框的最小面积C,由其长度的平方计算为:


通过最小化C,预测框可以在4个方向向真实框移动, 因此将SDIoU定义为:


其中,ρ表示一个有利于重叠区的正的权衡值(在文中所有的实验中都设定ρ=1)。作者在分子中同时使用I和(-S)来对交叉区域进行评分,同时对非重叠区域进行惩罚。因此,预测的4个距离值被强制要求与ground-truth距离更快匹配。SDIoU的损失最终被定义为LIoU = 1 - IoU。图12展示了SDIoU损失中所考虑的区域。


图12. box regression的SDIoU损失区域

当前 SOTA!平台收录 ObjectBox 共 1 个模型实现资源。


项目 SOTA!平台项目详情页
ObjectBox 前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/project/objectbox


前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及API等资源。

网页端访问:在浏览器地址栏输入新版站点地址 sota.jiqizhixin.com ,即可前往「SOTA!模型」平台,查看关注的模型是否有新资源收录。

移动端访问:在微信移动端中搜索服务号名称「机器之心SOTA模型」或 ID 「sotaai」,关注 SOTA!模型服务号,即可通过服务号底部菜单栏使用平台功能,更有最新AI技术、开发资源及社区动态定期推送。

相关文章
|
存储 SQL 分布式计算
用户画像系列—如何从0到1建设用户画像
用户画像系列—如何从0到1建设用户画像
327 0
|
2月前
|
数据可视化 物联网 开发者
深度解析四大LLM微调工具:从单卡到千亿级训练的四大解决方案
本文详解大语言模型微调四大工具——Unsloth、Axolotl、LlamaFactory、DeepSpeed,覆盖从单卡实验到万亿参数分布式训练场景,助你掌握主流框架选型策略,提升微调效率。建议点赞收藏。
544 0
|
7月前
|
JSON JavaScript 前端开发
怎么安装JSON服务器?JSON服务器最新安装教程
JSON Server是一款轻量级工具,基于Node.js运行,可通过单个JSON文件快速模拟RESTful API,适用于开发与测试场景。其支持CRUD操作、自定义路由及高级功能如排序、搜索、分页等,同时允许通过中间件扩展功能。为确保安全性,建议在受控环境中使用,并避免处理敏感数据。此外,还有Mirage JS、Mockoon、WireMock和Postman等替代方案,可根据项目需求选择合适的工具。
253 0
|
12月前
|
Java
利用GraalVM将java文件变成exe可执行文件
这篇文章简明地介绍了如何使用GraalVM将一个简单的Java程序编译成exe可执行文件,首先通过javac命令编译Java文件生成class文件,然后使用native-image命令将class文件转换成独立的exe文件,并展示了如何运行这个exe文件。
334 0
利用GraalVM将java文件变成exe可执行文件
|
8月前
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【Head】| 引入RT-DETR中的RTDETRDecoder,替换检测头
YOLOv11改进策略【Head】| 引入RT-DETR中的RTDETRDecoder,替换检测头
551 11
YOLOv11改进策略【Head】| 引入RT-DETR中的RTDETRDecoder,替换检测头
|
分布式计算 DataWorks 调度
阿里云DataWorks-部署自定义python项目问题
阿里云DataWorks-多种方式部署自定义python项目并进行调度
|
机器学习/深度学习 自然语言处理 计算机视觉
YOLOv8改进 | 2023 | 给YOLOv8换个RT-DETR的检测头(重塑目标检测前沿技术)
YOLOv8改进 | 2023 | 给YOLOv8换个RT-DETR的检测头(重塑目标检测前沿技术)
821 0
|
数据可视化 算法 大数据
深入解析高斯过程:数学理论、重要概念和直观可视化全解
这篇文章探讨了高斯过程作为解决小数据问题的工具,介绍了多元高斯分布的基础和其边缘及条件分布的性质。文章通过线性回归与维度诅咒的问题引出高斯过程,展示如何使用高斯过程克服参数爆炸的问题。作者通过数学公式和可视化解释了高斯过程的理论,并使用Python的GPy库展示了在一维和多维数据上的高斯过程回归应用。高斯过程在数据稀疏时提供了一种有效的方法,但计算成本限制了其在大数据集上的应用。
812 1
|
存储 边缘计算 人工智能
|
移动开发 JavaScript 小程序
扩展应用功能的无限可能——UniApp生态系统中的组件库探索(一)(上)
扩展应用功能的无限可能——UniApp生态系统中的组件库探索(一)