【论文速递】20 年的目标检测:一项调查

简介: 【论文速递】20 年的目标检测:一项调查

【论文原文】Object Detection in 20 Years: A Survey

论文:https://arxiv.org/abs/1905.05055v2

博主关键词:目标检测

推荐相关论文:

- 无


摘要


目标检测作为计算机视觉中最基本和最具挑战性的问题之一,近年来受到了极大的关注。它在过去二十年的发展可以看作是计算机视觉历史的缩影。如果我们把今天的目标检测看作深度学习力量下的一种技术美学,那么时光倒流20年,我们就会见证冷兵器时代的智慧。本文根据其技术演变广泛回顾了 400多篇目标检测论文,跨越了四分之一个世纪(从1990年代到2019年)。本文涵盖了许多主题,包括历史上的里程碑探测器、检测数据集、指标、检测系统的基本构建、加速技术以及最新最先进的检测方法。本文还综述了一些重要的检测应用,如行人检测、人脸检测、文本检测等,并深入分析了近年来它们面临的挑战和技术改进。


简介


目标检测是一项重要的计算机视觉任务,用于检测数字图像中特定类别的视觉对象(如人类、动物或汽车)的实例。目标检测的目的是开发计算模型和技术,提供计算机视觉应用程序所需的最基本的信息之一:哪些对象在哪里?作为计算机视觉的基本问题之一,目标检测构成了许多其他计算机视觉任务的基础,例如实例分割、图像字幕、对象跟踪等。从应用角度来看,目标检测可以分为“一般目标检测”和“检测应用”两个研究课题,前者旨在探索在统一框架下检测不同类型目标的方法,以模拟人类的视觉和认知,后者则指特定应用场景下的检测,如行人检测、人脸检测、文字检测等。近年来,深度学习技术的快速发展为目标检测带来了新鲜血液,取得了显著的突破,并推动其成为前所未有的关注研究热点。目标检测现已广泛应用于许多实际应用中,如自动驾驶、机器人视觉、视频监控等。图1显示了过去二十年中与“目标检测”相关的出版物数量不断增加。

640.png

• 与其他相关综述的区别

近年来发表了许多关于一般目标检测的综述。本文与上述综述的主要区别总结如下:

  1. 根据技术演变进行全面综述:本文广泛回顾了目标检测发展史上的400多篇论文,跨越了四分之一个世纪(从1990年代到2019年)。以前的大多数评论只关注一个短暂的历史时期或一些特定的检测任务,而不考虑其整个生命周期的技术演变。站在历史的高速公路上,不仅有助于读者构建完整的知识层次,也有助于在这个快速发展的领域找到未来的方向。
  2. 对关键技术和最新技术的深入探索:经过多年的发展,最先进的目标检测系统已经与“多尺度检测”、“硬负挖掘”、“边界框回归”等大量技术相结合。然而,以前的评论缺乏基本分析来帮助读者理解这些复杂技术的本质,例如,“它们来自哪里,它们是如何演变的?“每组方法的优缺点是什么?”本文对读者的上述问题进行了深入分析。
  3. 检测加速技术的综合分析:目标检测的加速长期以来一直是一项至关重要但具有挑战性的任务。本文从“检测管道”(如级联检测、特征图共享计算)、“检测主干”(如网络压缩、轻量级网络设计)和“数值计算”(如积分图像、向量量化)等多个层面,对20年目标检测历史中的加速技术进行了广泛的综述。以前的综述很少涉及这个主题。

• 目标检测的难点和挑战

尽管人们总是问“目标检测的困难和挑战是什么?”,但实际上,这个问题并不容易回答,甚至可能过于概括。由于不同的检测任务具有完全不同的目标和限制,因此它们的难度可能各不相同。除了不同视点下的物体、光照、类内变化等其他计算机视觉任务中的一些常见挑战外,物体检测的挑战包括但不限于以下几个方面:物体旋转和尺度变化(例如小物体)、准确的物体定位、密集和遮挡物体检测、检测速度等。在第4节和第5节中,我们将对这些主题进行更详细的分析。本文的其余部分组织如下。在第2节中,我们回顾了20年来目标检测的进化历史。第3节将介绍一些目标检测中的加速技术。第4节总结了最近三年的一些最先进的检测方法。一些重要的检测应用将在第5节中回顾。在第6节中,我们总结了本文,并对进一步的研究方向进行了分析。

相关文章
|
2月前
|
人工智能 算法 机器人
大学生智能体开发实训:衔接教育与产业的国家人才培养实践
王宇曾因缺乏实战经验求职受挫,参与“智能体来了”实训后,完成校园智能机器人项目,掌握从需求分析到部署的全流程开发技能,团队成果获企业认可。该项目对接国家AI教育政策,融合产教资源,帮助学生跨越理论与实践鸿沟,实现高效就业。
|
机器学习/深度学习 计算机视觉
YOLOv5改进 | EIoU、SIoU、WIoU、DIoU、FocusIoU等二十余种损失函数
YOLOv5改进 | EIoU、SIoU、WIoU、DIoU、FocusIoU等二十余种损失函数
2927 0
|
机器学习/深度学习 监控 算法
目标检测的发展与现状
目标检测领域发展至今已有二十余载,从早期的传统方法到如今的深度学习方法,精度越来越高的同时速度也越来越快,这得益于深度学习等相关技术的不断发展。
1927 0
|
机器学习/深度学习 自然语言处理
自然语言处理Transformer模型最详细讲解(图解版)
自然语言处理Transformer模型最详细讲解(图解版)
11452 1
自然语言处理Transformer模型最详细讲解(图解版)
|
XML Android开发 数据格式
Android实现ProgressBar旋转菊花加载的动画
Android实现ProgressBar旋转菊花加载的动画 在一些常见到的加载中需要显示一个加载动画,如旋转的菊花这样的动画效果,开发中有两种方案,一种是直接让设计师给出一个gif图片,然后写入到布局,另外一种,使用Android动画,把一张静止的图片动起来,本例用后者实现。
4003 0
|
Windows
mathtype7产品激活密钥最新
MathType是强大的数学公式编辑器,MathType公式编辑器可以说是专门为理科生准备的软件,它可以帮助用户快速的在各种文档中插入符号和公式,不论是简单的公式和符号,还是复杂的都可以非常轻松的输入,并且在与office文档结合使用时,表现的非常完美,是非常好的一款软件,与常见的文字处理软件和演示程序配合使用,能够在各种文档中加入复杂的数学公式和符号,可用在编辑数学试卷、书籍、报刊、论文、幻灯演示等方面,是编辑数学资料的得力工具。
51735 0
|
机器学习/深度学习 编解码 IDE
用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
|
7月前
|
人工智能 架构师 算法
人工智能+:职业价值的重构与技能升级
当“人工智能+”成为产业升级标配,职业价值正被重新定义。这并非简单岗位替代,而是人机协作新模式的诞生。AI接管重复性任务后,从业者可专注创造性活动,职业“含人量”不降反升。未来高价值岗位集中在技术赋能、场景创新与价值监督三层面,需跨界人才、流程架构师及伦理师等新角色。把握机遇需重构学习逻辑,强化人机协作实训与伦理素养,发展放大人类独特性的能力,构建不可替代的“人类+”优势。
|
6月前
|
安全 测试技术 开发者
银行转账模拟器手机版app, 银行转账凭证生成器app,用autojs实现效果【逼真效果】
本内容展示了一套基于Auto.js的银行APP自动化测试脚本和框架,用于学习和研究移动应用测试技术。脚本涵盖登录、转账等功能测试
|
5月前
|
缓存 边缘计算 前端开发
从业务需求到技术栈:电商API选型RESTful还是GraphQL?这5个维度帮你决策
在数字经济时代,电商平台的竞争已延伸至用户体验与系统效能。作为连接前后端及各类服务的核心,API接口的架构设计至关重要。本文对比RESTful与GraphQL两大主流方案,从电商场景出发,分析两者的技术特性、适用场景与选型逻辑,帮助开发者根据业务需求做出最优选择。

热门文章

最新文章