深度学习目标检测技术研究现状

简介: 深度学习技术在目标检测算法的应用显著提升了算法的性能。基于传统的目标检测算法对目标检测任务进行了概述,包括评价指标、公开数据集、算法框架及传统算法的缺陷。

      目标检测是机器视觉的一个分支,在车辆检测、商品分拣等生活及工业领域都具有重要的应用和研究价值,其目的是从计算机层面检测出图像中所检测物体的名称和该物体的位置关系(主要指物体在图片中的所处位置和该物体的像素大小)。传统的目标检测算法主要是基于各种模板,通过提取特征点、生成特征数据、进行特征数据匹配或利用机器学习方法实现图像的识别与检测。2012 年,是目标检测史上具有划时代意义的一年,自此越来越多的科研工作者投身于深度学习方面的研究,研究出了一批批优秀的算法。是因为这一年 Hinton 等提出了 AlexNet卷积网络模型,在 ImageNet 上超出第二名 41%,相较于传统目标检测实现了跨越式的提升。

     在深度学习未兴起之前,目标检测算法分为目标实例和目标类别两类:(1)目标实例检测,通过提取图像关键点、生成特征数据、进行数据匹配,检测出目标对象;(2)目标类别检测,通过机器学习方法对特征数据进行二分类或多分类,实现目标对象检测和识别。

      对于目标实例检测,2004 年 Lowe 等提出了 SIFT[19]算法,该算法通过高斯模糊、高斯差分函数运算分别实现了尺度空间和极值检测,得到的关键点匹配度高、抗噪性强。但该算法在特征不明显的图像上无法提取有效特征点,而且算法复杂度高、运行速度慢。为了克服 SIFT 算法的弊端,Ke 等人后续提出了 PCA-SIFT算法。该算法通过运用 PCA 方法对算法中向量进行降维,匹配效率获得了提升。但降维带来的信息损失使算法的匹配效果相较于 SIFT 有所下降。2006 年,Bay H等人基于 SIFT 提出了 SURF[21]算法,通过 Hessian 矩阵,减小了计算量,检测速度获得了提升。对于目标类别检测,通常采取 AdaBoost[22]系列算法。Adaboost 算法,通过调整训练集样本权重将多个弱学习器组合为一个强学习器,实现目标特征数据的有效提取,完成检测识别。

       传统的目标检测算法,主要是围绕如何有效实现人工提取图像特征点,生成子特征数据完成图像目标识别和在此基础上如何最大限度减少计算量,提高检测速度这两方面展开的研究。但人工提取特征的方式过于简单,无法应用训练好的模型在类似的目标上,在目标改变时,需要有针对性地再次重复特征提取过程,给科研人员带来了繁重的工作量。深度学习的出现给科研带来了另一个研究方向。计算机通过 CNN 进行卷积、非线性激活、池化等一系列操作,可自动提取图像特征,相较于人工提取的特征,计算机提取出来的特征更加丰富、表达性更强。同时后续的计算量也大大减少,模型的检测速度甚至可以实现实时预测。

      随着近几年人工智能领域的飞速发展,在目标检测方面出现了很多优秀的算法。按照阶段数的不同,可以分为多阶段目标检测、两阶段目标检测(two-stage)和单阶段目标检测(one-stage)。多阶段目标检测中具有代表性的是 CascadeR-CNN算法;两阶段目标检测中具有代表性的是 R-CNN系列的算法;在单阶段目标检测中具有代表性的是 SSD、YOLO(You Only Look Once,简称 YOLO)系列、EfficientNet、RetinaNet、EfficientDet 等。目前目标检测研究以单阶段和两阶段目标检测算法为主。

     two-stage 在某种意义上是传统目标检测算法的研究方式上的延伸,而one-stage 则是将目标检测看作是回归问题来解决。易知,two-stage 目标检测主要划分为两步:第一步是生成 Region Proposal,使用 CNN 提取特征;第二步是使用分类器分类并修正位置。2014 年,Ross Girshick 等提出了 R-CNN算法,该算法大幅度提高了目标检测的准确率,但由于 R-CNN 是对所有的候选区域进行特征提取和计算,导致了大量重复计算,降低了运算效率。因此,R-CNN 的实时性不强,并且非常占用存储资源。同年,何凯明等人提出了 SPP-Net有效地解决了 R-CNN重复计算的问题,但 R-CNN 占用存储空间过多的问题没有得到解决。2015 年,基于 SPP-Net 改进的 Fast R-CNN,提高了计算速度,同时解决了内存占用过多问题。Faster R-CNN针对 Selective Search 的问题,提出使用 RPN 进行边框训练,有效地提升了检测速度。但 Faster R-CNN 沿用了 ROI 检测子网络,在小目标的检测上效果还有待提升。同时受限于 two-stage 算法设计思路,Faster R-CNN 算法最快达 5FPS。

     为了提升算法的时效性,学者提出了 one-stage 算法。直接将目标检测看作回归问題,无需选择候选区域及提取特征,通过对输入图像操作直接回归出目标位置和类别。YOLO系列算法正是基于此发展而来。YOLO 算法速度得到了提升,最高可迖 45FPS。同年,SSD算法提出了一种利用单一深度神经网络检测图像中目标的方法。融合了 FasterR-CNN 和 YOLO 的优点,在保证检测精度的同时,提升了检测速度。之后一年,YOLO 原作者在 YOLOv1(YOLO 系列算法第 1 个版本,简称 YOLOv1)基础上提出了 YOLOv2(YOLO 系列算法第 2 个版本,简称 YOLOv2)算法,主要解决了过拟合现像和预设先验框不合理,提高了检测速度和检测精度。翌年,YOLOv3(YOLO 系列算法第 3 个版本,简称 YOLOv3)基于 YOLOv2 进行了全面的升级,在保持高检测速度的前提下,重点增强了对小目标的检测识别。此后,YOLOv3 原作者因个人原因宣布退出 CV 领域,2020 年 4月,YOLOv4(YOLO 系列算法第 4 个版本,简称 YOLOv4)作者在 YOLOv3基础上,在 CSPNet 中增加了 SPP 和 PANet,实现了检测速度和检测精度的进一步提升。两个月后,YOLOv5(YOLO 系列算法第 5 个版本,简称 YOLOv5)在GitHub 上开放其源码,进一步在提升精确度的同时加快了速度。与 YOLOv4 不同的是,其同时推出了不同精确度和检测速度的 YOLOv5 版本,更有利于移动端的部署,是当前业界最优秀的目标检测算法。针对不同的应用场景,但是在调研中也发现每个算法都有其适用范围,没有不好的算法,只有更合适的场景。

相关文章
|
28天前
|
机器学习/深度学习 传感器 边缘计算
基于深度学习的图像识别技术在自动驾驶中的应用####
随着人工智能技术的飞速发展,深度学习已成为推动自动驾驶技术突破的关键力量之一。本文深入探讨了深度学习算法,特别是卷积神经网络(CNN)在图像识别领域的创新应用,以及这些技术如何被集成到自动驾驶汽车的视觉系统中,实现对复杂道路环境的实时感知与理解,从而提升驾驶的安全性和效率。通过分析当前技术的最前沿进展、面临的挑战及未来趋势,本文旨在为读者提供一个全面而深入的视角,理解深度学习如何塑造自动驾驶的未来。 ####
100 1
|
2月前
|
机器学习/深度学习 数据采集 传感器
基于深度学习的图像识别技术在自动驾驶中的应用研究####
本文旨在探讨深度学习技术,特别是卷积神经网络(CNN)在自动驾驶车辆图像识别领域的应用与进展。通过分析当前自动驾驶技术面临的挑战,详细介绍了深度学习模型如何提升环境感知能力,重点阐述了数据预处理、网络架构设计、训练策略及优化方法,并展望了未来发展趋势。 ####
117 6
|
1月前
|
机器学习/深度学习 算法框架/工具 网络架构
深度学习中的正则化技术及其对模型性能的影响
本文深入探讨了深度学习领域中正则化技术的重要性,通过分析L1、L2以及Dropout等常见正则化方法,揭示了它们如何帮助防止过拟合,提升模型的泛化能力。文章还讨论了正则化在不同类型的神经网络中的应用,并指出了选择合适正则化策略的关键因素。通过实例和代码片段,本文旨在为读者提供关于如何在实际问题中有效应用正则化技术的深刻见解。
|
28天前
|
机器学习/深度学习 存储 人工智能
探索深度学习的奥秘:从理论到实践的技术感悟
本文深入探讨了深度学习技术的核心原理、发展历程以及在实际应用中的体验与挑战。不同于常规摘要,本文旨在通过作者个人的技术实践经历,为读者揭示深度学习领域的复杂性与魅力,同时提供一些实用的技术见解和解决策略。
30 0
|
1月前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术及其在自动驾驶中的应用####
本文深入探讨了深度学习驱动下的图像识别技术,特别是在自动驾驶领域的革新应用。不同于传统摘要的概述方式,本节将直接以“深度学习”与“图像识别”的技术融合为起点,简述其在提升自动驾驶系统环境感知能力方面的核心作用,随后快速过渡到自动驾驶的具体应用场景,强调这一技术组合如何成为推动自动驾驶从实验室走向市场的关键力量。 ####
67 0
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深入探讨人工智能中的深度学习技术##
在本文中,我们将深入探讨深度学习技术的原理、应用以及未来的发展趋势。通过分析神经网络的基本结构和工作原理,揭示深度学习如何在图像识别、自然语言处理等领域取得突破性进展。同时,我们还将讨论当前面临的挑战和未来的研究方向,为读者提供全面的技术洞察。 ##
|
26天前
|
机器学习/深度学习 传感器 数据采集
深度学习在故障检测中的应用:从理论到实践
深度学习在故障检测中的应用:从理论到实践
115 5
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习的原理与应用:开启智能时代的大门
深度学习的原理与应用:开启智能时代的大门
84 16
|
18天前
|
机器学习/深度学习 网络架构 计算机视觉
深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过研究卷积神经网络(CNN)的结构和原理,本文展示了深度学习如何提高图像识别的准确性和效率。同时,本文也讨论了数据不平衡、过拟合、计算资源限制等问题,并提出了相应的解决策略。
77 19
|
18天前
|
机器学习/深度学习 传感器 人工智能
探索深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文深入探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过介绍卷积神经网络(CNN)的基本原理和架构设计,阐述了深度学习如何有效地从图像数据中提取特征,并在多个领域实现突破性进展。同时,文章也指出了训练深度模型时常见的过拟合问题、数据不平衡以及计算资源需求高等挑战,并提出了相应的解决策略。
70 7