【论文速递】20 年的目标检测:一项调查

简介: 【论文速递】20 年的目标检测:一项调查

【论文原文】Object Detection in 20 Years: A Survey

论文:https://arxiv.org/abs/1905.05055v2

博主关键词:目标检测

推荐相关论文:

- 无


摘要


目标检测作为计算机视觉中最基本和最具挑战性的问题之一,近年来受到了极大的关注。它在过去二十年的发展可以看作是计算机视觉历史的缩影。如果我们把今天的目标检测看作深度学习力量下的一种技术美学,那么时光倒流20年,我们就会见证冷兵器时代的智慧。本文根据其技术演变广泛回顾了 400多篇目标检测论文,跨越了四分之一个世纪(从1990年代到2019年)。本文涵盖了许多主题,包括历史上的里程碑探测器、检测数据集、指标、检测系统的基本构建、加速技术以及最新最先进的检测方法。本文还综述了一些重要的检测应用,如行人检测、人脸检测、文本检测等,并深入分析了近年来它们面临的挑战和技术改进。


简介


目标检测是一项重要的计算机视觉任务,用于检测数字图像中特定类别的视觉对象(如人类、动物或汽车)的实例。目标检测的目的是开发计算模型和技术,提供计算机视觉应用程序所需的最基本的信息之一:哪些对象在哪里?作为计算机视觉的基本问题之一,目标检测构成了许多其他计算机视觉任务的基础,例如实例分割、图像字幕、对象跟踪等。从应用角度来看,目标检测可以分为“一般目标检测”和“检测应用”两个研究课题,前者旨在探索在统一框架下检测不同类型目标的方法,以模拟人类的视觉和认知,后者则指特定应用场景下的检测,如行人检测、人脸检测、文字检测等。近年来,深度学习技术的快速发展为目标检测带来了新鲜血液,取得了显著的突破,并推动其成为前所未有的关注研究热点。目标检测现已广泛应用于许多实际应用中,如自动驾驶、机器人视觉、视频监控等。图1显示了过去二十年中与“目标检测”相关的出版物数量不断增加。

640.png

• 与其他相关综述的区别

近年来发表了许多关于一般目标检测的综述。本文与上述综述的主要区别总结如下:

  1. 根据技术演变进行全面综述:本文广泛回顾了目标检测发展史上的400多篇论文,跨越了四分之一个世纪(从1990年代到2019年)。以前的大多数评论只关注一个短暂的历史时期或一些特定的检测任务,而不考虑其整个生命周期的技术演变。站在历史的高速公路上,不仅有助于读者构建完整的知识层次,也有助于在这个快速发展的领域找到未来的方向。
  2. 对关键技术和最新技术的深入探索:经过多年的发展,最先进的目标检测系统已经与“多尺度检测”、“硬负挖掘”、“边界框回归”等大量技术相结合。然而,以前的评论缺乏基本分析来帮助读者理解这些复杂技术的本质,例如,“它们来自哪里,它们是如何演变的?“每组方法的优缺点是什么?”本文对读者的上述问题进行了深入分析。
  3. 检测加速技术的综合分析:目标检测的加速长期以来一直是一项至关重要但具有挑战性的任务。本文从“检测管道”(如级联检测、特征图共享计算)、“检测主干”(如网络压缩、轻量级网络设计)和“数值计算”(如积分图像、向量量化)等多个层面,对20年目标检测历史中的加速技术进行了广泛的综述。以前的综述很少涉及这个主题。

• 目标检测的难点和挑战

尽管人们总是问“目标检测的困难和挑战是什么?”,但实际上,这个问题并不容易回答,甚至可能过于概括。由于不同的检测任务具有完全不同的目标和限制,因此它们的难度可能各不相同。除了不同视点下的物体、光照、类内变化等其他计算机视觉任务中的一些常见挑战外,物体检测的挑战包括但不限于以下几个方面:物体旋转和尺度变化(例如小物体)、准确的物体定位、密集和遮挡物体检测、检测速度等。在第4节和第5节中,我们将对这些主题进行更详细的分析。本文的其余部分组织如下。在第2节中,我们回顾了20年来目标检测的进化历史。第3节将介绍一些目标检测中的加速技术。第4节总结了最近三年的一些最先进的检测方法。一些重要的检测应用将在第5节中回顾。在第6节中,我们总结了本文,并对进一步的研究方向进行了分析。

相关文章
|
机器学习/深度学习 监控 算法
目标检测的发展与现状
目标检测领域发展至今已有二十余载,从早期的传统方法到如今的深度学习方法,精度越来越高的同时速度也越来越快,这得益于深度学习等相关技术的不断发展。
1897 0
|
XML Android开发 数据格式
Android实现ProgressBar旋转菊花加载的动画
Android实现ProgressBar旋转菊花加载的动画 在一些常见到的加载中需要显示一个加载动画,如旋转的菊花这样的动画效果,开发中有两种方案,一种是直接让设计师给出一个gif图片,然后写入到布局,另外一种,使用Android动画,把一张静止的图片动起来,本例用后者实现。
3985 0
|
机器学习/深度学习 计算机视觉
YOLOv5改进 | EIoU、SIoU、WIoU、DIoU、FocusIoU等二十余种损失函数
YOLOv5改进 | EIoU、SIoU、WIoU、DIoU、FocusIoU等二十余种损失函数
2870 0
|
机器学习/深度学习 自然语言处理
自然语言处理Transformer模型最详细讲解(图解版)
自然语言处理Transformer模型最详细讲解(图解版)
11139 1
自然语言处理Transformer模型最详细讲解(图解版)
|
Windows
mathtype7产品激活密钥最新
MathType是强大的数学公式编辑器,MathType公式编辑器可以说是专门为理科生准备的软件,它可以帮助用户快速的在各种文档中插入符号和公式,不论是简单的公式和符号,还是复杂的都可以非常轻松的输入,并且在与office文档结合使用时,表现的非常完美,是非常好的一款软件,与常见的文字处理软件和演示程序配合使用,能够在各种文档中加入复杂的数学公式和符号,可用在编辑数学试卷、书籍、报刊、论文、幻灯演示等方面,是编辑数学资料的得力工具。
50868 0
|
机器学习/深度学习 编解码 IDE
用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
|
3月前
|
安全 数据可视化 API
什么是低代码?为什么低代码开发很重要?
低代码开发是一种通过可视化工具和少量编码快速构建应用程序的方法,帮助企业提升开发效率、降低成本,应对开发人员短缺问题。它让非专业开发者也能参与应用创建,同时让专业开发者更专注于复杂项目。低代码平台支持业务流程自动化、客户体验优化等多类应用开发,助力企业加速数字化转型。
|
3月前
|
算法 安全 搜索推荐
算法备案办官方流程
企业办理算法备案需登录备案系统,填写主体及算法信息并提交相关材料。流程包括注册备案、算法信息填报、产品信息提交、审核与公示等环节。企业需提前准备营业执照、身份证明等文件,确保资质真实有效。审核分为主体审核、一审和二审,通过后进入国家网信办公示,公示无异议即获备案号。整个流程约需1个月左右,具体以官方要求为准。
|
XML JSON 数据可视化
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)
本文详细介绍了不同数据集格式之间的转换方法,包括YOLO、VOC、COCO、JSON、TXT和PNG等格式,以及如何可视化验证数据集。
3275 1
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)

热门文章

最新文章