【论文速递】20 年的目标检测:一项调查

简介: 【论文速递】20 年的目标检测:一项调查

【论文原文】Object Detection in 20 Years: A Survey

论文:https://arxiv.org/abs/1905.05055v2

博主关键词:目标检测

推荐相关论文:

- 无


摘要


目标检测作为计算机视觉中最基本和最具挑战性的问题之一,近年来受到了极大的关注。它在过去二十年的发展可以看作是计算机视觉历史的缩影。如果我们把今天的目标检测看作深度学习力量下的一种技术美学,那么时光倒流20年,我们就会见证冷兵器时代的智慧。本文根据其技术演变广泛回顾了 400多篇目标检测论文,跨越了四分之一个世纪(从1990年代到2019年)。本文涵盖了许多主题,包括历史上的里程碑探测器、检测数据集、指标、检测系统的基本构建、加速技术以及最新最先进的检测方法。本文还综述了一些重要的检测应用,如行人检测、人脸检测、文本检测等,并深入分析了近年来它们面临的挑战和技术改进。


简介


目标检测是一项重要的计算机视觉任务,用于检测数字图像中特定类别的视觉对象(如人类、动物或汽车)的实例。目标检测的目的是开发计算模型和技术,提供计算机视觉应用程序所需的最基本的信息之一:哪些对象在哪里?作为计算机视觉的基本问题之一,目标检测构成了许多其他计算机视觉任务的基础,例如实例分割、图像字幕、对象跟踪等。从应用角度来看,目标检测可以分为“一般目标检测”和“检测应用”两个研究课题,前者旨在探索在统一框架下检测不同类型目标的方法,以模拟人类的视觉和认知,后者则指特定应用场景下的检测,如行人检测、人脸检测、文字检测等。近年来,深度学习技术的快速发展为目标检测带来了新鲜血液,取得了显著的突破,并推动其成为前所未有的关注研究热点。目标检测现已广泛应用于许多实际应用中,如自动驾驶、机器人视觉、视频监控等。图1显示了过去二十年中与“目标检测”相关的出版物数量不断增加。

640.png

• 与其他相关综述的区别

近年来发表了许多关于一般目标检测的综述。本文与上述综述的主要区别总结如下:

  1. 根据技术演变进行全面综述:本文广泛回顾了目标检测发展史上的400多篇论文,跨越了四分之一个世纪(从1990年代到2019年)。以前的大多数评论只关注一个短暂的历史时期或一些特定的检测任务,而不考虑其整个生命周期的技术演变。站在历史的高速公路上,不仅有助于读者构建完整的知识层次,也有助于在这个快速发展的领域找到未来的方向。
  2. 对关键技术和最新技术的深入探索:经过多年的发展,最先进的目标检测系统已经与“多尺度检测”、“硬负挖掘”、“边界框回归”等大量技术相结合。然而,以前的评论缺乏基本分析来帮助读者理解这些复杂技术的本质,例如,“它们来自哪里,它们是如何演变的?“每组方法的优缺点是什么?”本文对读者的上述问题进行了深入分析。
  3. 检测加速技术的综合分析:目标检测的加速长期以来一直是一项至关重要但具有挑战性的任务。本文从“检测管道”(如级联检测、特征图共享计算)、“检测主干”(如网络压缩、轻量级网络设计)和“数值计算”(如积分图像、向量量化)等多个层面,对20年目标检测历史中的加速技术进行了广泛的综述。以前的综述很少涉及这个主题。

• 目标检测的难点和挑战

尽管人们总是问“目标检测的困难和挑战是什么?”,但实际上,这个问题并不容易回答,甚至可能过于概括。由于不同的检测任务具有完全不同的目标和限制,因此它们的难度可能各不相同。除了不同视点下的物体、光照、类内变化等其他计算机视觉任务中的一些常见挑战外,物体检测的挑战包括但不限于以下几个方面:物体旋转和尺度变化(例如小物体)、准确的物体定位、密集和遮挡物体检测、检测速度等。在第4节和第5节中,我们将对这些主题进行更详细的分析。本文的其余部分组织如下。在第2节中,我们回顾了20年来目标检测的进化历史。第3节将介绍一些目标检测中的加速技术。第4节总结了最近三年的一些最先进的检测方法。一些重要的检测应用将在第5节中回顾。在第6节中,我们总结了本文,并对进一步的研究方向进行了分析。

相关文章
|
6天前
|
人工智能 自然语言处理 监控
GPT-4整治学术不端!人大/浙大团队实测7000篇论文,撤稿预测与人类95%一致
【4月更文挑战第15天】中国人民大学和浙江大学的研究团队利用GPT-4模型预测论文撤稿,研究基于3,505篇撤稿及未撤稿论文的推特数据,发现16%的撤稿论文提及含有预警信号,预测准确度高达92.86%。GPT-4预测一致性达95%,为学术诚信监控提供新途径。但研究受限于主观偏见、撤稿原因区分及推特互动等因素。
37 1
GPT-4整治学术不端!人大/浙大团队实测7000篇论文,撤稿预测与人类95%一致
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
论文推荐:大语言模型在金融领域的应用调查
这篇论文总结了现有LLM在金融领域的应用现状,推荐和金融相关或者有兴趣的朋友都看看
64 0
|
11月前
|
机器学习/深度学习 传感器 人工智能
自动驾驶竞逐城市NOA,轻舟智航这篇ICML2023论文为「感知模块评估」指出了新方向(1)
自动驾驶竞逐城市NOA,轻舟智航这篇ICML2023论文为「感知模块评估」指出了新方向
|
12月前
|
机器学习/深度学习 数据采集 人工智能
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写(2)
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写
192 0
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写(1)
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写
293 0
|
机器学习/深度学习 人工智能 运维
ECCV 2022 Oral | 无需微调即可推广,上交大、上海人工智能实验室等提出基于配准的少样本异常检测框架
ECCV 2022 Oral | 无需微调即可推广,上交大、上海人工智能实验室等提出基于配准的少样本异常检测框架
100 0
|
机器学习/深度学习 存储 人工智能
对比学习引领弱标签学习新SOTA,浙大新研究入选ICLR Oral
对比学习引领弱标签学习新SOTA,浙大新研究入选ICLR Oral
|
机器学习/深度学习 运维 自然语言处理
时序分析五边形战士!清华提出TimesNet:预测、填补、分类、检测全面领先|ICLR 2023(1)
时序分析五边形战士!清华提出TimesNet:预测、填补、分类、检测全面领先|ICLR 2023
578 1
|
机器学习/深度学习 运维 算法
时序分析五边形战士!清华提出TimesNet:预测、填补、分类、检测全面领先|ICLR 2023(2)
时序分析五边形战士!清华提出TimesNet:预测、填补、分类、检测全面领先|ICLR 2023
856 0
|
机器学习/深度学习 数据可视化 数据挖掘
CVPR 2023|哈工大南洋理工提出全球首个「多模态DeepFake检测定位」模型:让AIGC伪造无处可藏
CVPR 2023|哈工大南洋理工提出全球首个「多模态DeepFake检测定位」模型:让AIGC伪造无处可藏
154 0