【论文速递】20 年的目标检测:一项调查

简介: 【论文速递】20 年的目标检测:一项调查

【论文原文】Object Detection in 20 Years: A Survey

论文:https://arxiv.org/abs/1905.05055v2

博主关键词:目标检测

推荐相关论文:

- 无


摘要


目标检测作为计算机视觉中最基本和最具挑战性的问题之一,近年来受到了极大的关注。它在过去二十年的发展可以看作是计算机视觉历史的缩影。如果我们把今天的目标检测看作深度学习力量下的一种技术美学,那么时光倒流20年,我们就会见证冷兵器时代的智慧。本文根据其技术演变广泛回顾了 400多篇目标检测论文,跨越了四分之一个世纪(从1990年代到2019年)。本文涵盖了许多主题,包括历史上的里程碑探测器、检测数据集、指标、检测系统的基本构建、加速技术以及最新最先进的检测方法。本文还综述了一些重要的检测应用,如行人检测、人脸检测、文本检测等,并深入分析了近年来它们面临的挑战和技术改进。


简介


目标检测是一项重要的计算机视觉任务,用于检测数字图像中特定类别的视觉对象(如人类、动物或汽车)的实例。目标检测的目的是开发计算模型和技术,提供计算机视觉应用程序所需的最基本的信息之一:哪些对象在哪里?作为计算机视觉的基本问题之一,目标检测构成了许多其他计算机视觉任务的基础,例如实例分割、图像字幕、对象跟踪等。从应用角度来看,目标检测可以分为“一般目标检测”和“检测应用”两个研究课题,前者旨在探索在统一框架下检测不同类型目标的方法,以模拟人类的视觉和认知,后者则指特定应用场景下的检测,如行人检测、人脸检测、文字检测等。近年来,深度学习技术的快速发展为目标检测带来了新鲜血液,取得了显著的突破,并推动其成为前所未有的关注研究热点。目标检测现已广泛应用于许多实际应用中,如自动驾驶、机器人视觉、视频监控等。图1显示了过去二十年中与“目标检测”相关的出版物数量不断增加。

640.png

• 与其他相关综述的区别

近年来发表了许多关于一般目标检测的综述。本文与上述综述的主要区别总结如下:

  1. 根据技术演变进行全面综述:本文广泛回顾了目标检测发展史上的400多篇论文,跨越了四分之一个世纪(从1990年代到2019年)。以前的大多数评论只关注一个短暂的历史时期或一些特定的检测任务,而不考虑其整个生命周期的技术演变。站在历史的高速公路上,不仅有助于读者构建完整的知识层次,也有助于在这个快速发展的领域找到未来的方向。
  2. 对关键技术和最新技术的深入探索:经过多年的发展,最先进的目标检测系统已经与“多尺度检测”、“硬负挖掘”、“边界框回归”等大量技术相结合。然而,以前的评论缺乏基本分析来帮助读者理解这些复杂技术的本质,例如,“它们来自哪里,它们是如何演变的?“每组方法的优缺点是什么?”本文对读者的上述问题进行了深入分析。
  3. 检测加速技术的综合分析:目标检测的加速长期以来一直是一项至关重要但具有挑战性的任务。本文从“检测管道”(如级联检测、特征图共享计算)、“检测主干”(如网络压缩、轻量级网络设计)和“数值计算”(如积分图像、向量量化)等多个层面,对20年目标检测历史中的加速技术进行了广泛的综述。以前的综述很少涉及这个主题。

• 目标检测的难点和挑战

尽管人们总是问“目标检测的困难和挑战是什么?”,但实际上,这个问题并不容易回答,甚至可能过于概括。由于不同的检测任务具有完全不同的目标和限制,因此它们的难度可能各不相同。除了不同视点下的物体、光照、类内变化等其他计算机视觉任务中的一些常见挑战外,物体检测的挑战包括但不限于以下几个方面:物体旋转和尺度变化(例如小物体)、准确的物体定位、密集和遮挡物体检测、检测速度等。在第4节和第5节中,我们将对这些主题进行更详细的分析。本文的其余部分组织如下。在第2节中,我们回顾了20年来目标检测的进化历史。第3节将介绍一些目标检测中的加速技术。第4节总结了最近三年的一些最先进的检测方法。一些重要的检测应用将在第5节中回顾。在第6节中,我们总结了本文,并对进一步的研究方向进行了分析。

相关文章
|
2月前
|
人工智能 算法 数据安全/隐私保护
无表情人脸预测政治信仰,AI准确率惊人!斯坦福研究登国际顶刊
【8月更文挑战第10天】斯坦福大学的研究揭示了面部识别技术的新应用:通过分析无表情人脸图片预测政治倾向。研究在《American Psychologist》发表,表明人类评估者与AI均能在控制人口统计学特征的情况下准确预测政治取向,相关系数分别为0.21和0.22。利用年龄、性别和种族信息时,算法准确性提升至0.31。研究还发现保守派倾向于有更大的下半部面部。尽管成果引人注目,但其局限性和潜在的隐私问题仍需审慎考量。
135 62
|
1月前
|
机器学习/深度学习 人工智能
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【9月更文挑战第1天】麻省理工学院(MIT)研究人员开发的深度学习AI模型,在乳腺癌早期预警方面取得突破性进展,相比传统方法提前5年预警癌症,准确率超过90%。此成果不仅在医学界引起轰动,还获得了人工智能领域知名学者Yann LeCun的高度评价。尽管面临准确性和可解释性的挑战,但该研究展示了AI在医疗领域的巨大潜力,有望革新乳腺癌的早期筛查和诊断方式。论文详情见[链接]。
39 3
|
4月前
|
人工智能
拯救被掰弯的GPT-4!西交微软北大联合提出IN2训练治疗LLM中间迷失
【6月更文挑战第1天】研究人员为解决大型语言模型(LLM)的“中间迷失”问题,提出了IN2训练方法。此方法通过显式监督增强模型对长文本上下文的理解,改善了信息检索能力。应用IN2训练的FILM-7B模型在长文本任务上表现出色,尤其在NarrativeQA数据集上的F1分数提升了3.4。尽管面临数据合成和计算成本的挑战,IN2训练为LLM的进步开辟了新途径,预示着未来在长文本处理领域的潜力。论文链接:https://arxiv.org/pdf/2404.16811
68 5
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
论文推荐:大语言模型在金融领域的应用调查
这篇论文总结了现有LLM在金融领域的应用现状,推荐和金融相关或者有兴趣的朋友都看看
349 0
|
机器学习/深度学习 运维 自然语言处理
时序分析五边形战士!清华提出TimesNet:预测、填补、分类、检测全面领先|ICLR 2023(1)
时序分析五边形战士!清华提出TimesNet:预测、填补、分类、检测全面领先|ICLR 2023
707 1
|
机器学习/深度学习 运维 算法
时序分析五边形战士!清华提出TimesNet:预测、填补、分类、检测全面领先|ICLR 2023(2)
时序分析五边形战士!清华提出TimesNet:预测、填补、分类、检测全面领先|ICLR 2023
1383 0
|
机器学习/深度学习 传感器 自动驾驶
自动驾驶竞逐城市NOA,轻舟智航这篇ICML2023论文为「感知模块评估」指出了新方向(2)
自动驾驶竞逐城市NOA,轻舟智航这篇ICML2023论文为「感知模块评估」指出了新方向
103 0
|
机器学习/深度学习 传感器 人工智能
自动驾驶竞逐城市NOA,轻舟智航这篇ICML2023论文为「感知模块评估」指出了新方向(1)
自动驾驶竞逐城市NOA,轻舟智航这篇ICML2023论文为「感知模块评估」指出了新方向
127 0
|
机器学习/深度学习 人工智能 自然语言处理
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写(1)
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写
360 0
|
机器学习/深度学习 数据采集 人工智能
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写(2)
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写
226 0