目标检测的国内外研究现状

简介: 作为计算机领域的一个重要的研究成果,深度卷积神经网络已经广泛用于图像分类问题。随着图像分类的准确度提高,基于卷积神经网络的图像目标检测算法已逐渐成为当前的研究热点。

    20 世纪以来,伴随着人工智能技术的飞速发展,各大人工智能领域的技术应用开始井喷式的出现,并在车牌检测、无人驾驶等方面得到广泛的发展与应用。相较于深度学习目标检测算法来说,传统目标检测算法由于其滑动窗口模型的特点,使得其对特征的提取和匹配具有一定的单一性,并且适应性、准确性和检测速度也相对较差,所以基于深度学习的目标检测算法就凭借其的结构简单的同时效率和准确性更高的优势,迅速赶超了传统目标检测算法,一跃成为最主流的目标检测算法,主要分为两个发展方向:两阶段(two-stage)模型和单阶段(one-stage)模型。

       两阶段(two-stage)模型是一种将检测问题分为选取候选区域和对选取的候选区域进行分类和位置修正这两个阶段的基于分类的目标检测算法,通过这两个阶段来实现最终对目标检测结果的输出。1998 年 Yann Le Cun 等人首次将卷积神经网络结构应用于对数字的识别,但在此之后神经网络算法的发展却一直止步不前行进缓慢。2012 年 Alex Krizhevsky等提出了网络结构 AlexNet,该网络在 ImageNet2012 挑战赛中一举夺冠,且效果远超传统算法,由此掀起了深度学习算法的热潮。作为 R-CNN 系列目标检测算法的奠基之作,Girshick R 于 2015 年基于 SPP-Net 算法结构,通过先运行再上传的方法,实现了卷积的共享运算,以此提出了改进的 Fast R-CNN 算法。为了获得更好的检测精度,Jifeng Dai 等人以 Fast R-CNN 为原型,于 2016 年提出了 R-FCN,实现了通过位置敏感分数图提升特征位置信息,从而达到加强监测精度的目的。何凯明等人因为 RoIPooling 经过 Pooling 后易发生形变,且会使得位置信息准确度下降,所以在 2017 年提出了 Mask R-CNN,通过改进 Faster R-CNN 来实现分割任务。

       以 R-CNN 算法为首的两阶段法在融合了 RPN 结构后,监测精度大大提高,但因为其属于基于分类的目标检测算法,因其具有监测速度较慢的特点,还是无法完成在大多数应用场合中对于监测实时性的要求,而当我们引入基于回归方法的目标检测算法时,该需求则得以满足。这一基于回归方向的目标检测算法又被称为单阶段(one-stage)模型,该算法仅需对图片进行单次的处理,就可实现目标位置和类别信息的共同获取。相较于基于区域提取 two-stage 来说,该算法不仅过程简单,其准确度和效率都得以大幅度提升,仅单次训练即可完成特征共享,其典型代表有 YOLO 系列、SSD。

     2016 年 Redmon J 等提出了一种新的目标检测算法 YOLO(You Only Look Once)。与基于分类的目标检测算法利用分类器来执行检测不同,YOLO 算法将目标检测框架看作空间上的回归问题,单个神经网络可经过一次运算从完整图像上得到边界框和类别概率的预测,有利于对检测性能进行端到端的优化。

   2018 年 YOLOv3 对 YOLOv2 进行了改进,YOLOv3 采用的模型比 YOLOv2 更大,进一步提高了小目标检测的准确率,但速度比 YOLOv2 稍慢。

    2020 年 YOLOv4 被提出,在 YOLOv3 算法的基础上增加了很多实用的技巧,使得它的速度与精度都得到了极大的提升。同年被提出的 YOLOv5 算法,不同于之前系列的单独模型,YOLOv5 以模型家族的形式被提出,包含 YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x。较之前的网络相比,YOLOv5 第一次使用 Pytorch,支持更简单、部署更容易,并且在准确率没有任何损失的情况下,图像的推理时间和检测平均精度得到全面的提升。YOLOv5 另外的一个优势在于体积很小,YOLOv5 的权重文件是 27 兆,YOLOv4 的权重文件是 244 兆。相比于 YOLOv4 来说,YOLOv5 仅有其 10%的大小,这也使得 YOLOv5能更轻松地在嵌入式设备上使用。


相关文章
|
SQL 存储 NoSQL
SQL vs. NoSQL:如何根据大数据需求选择合适数据库
【4月更文挑战第8天】本文对比分析了SQL与NoSQL数据库在大数据项目中的应用。SQL数据库适合结构化数据、强一致性和复杂事务处理,如金融系统,而NoSQL则适用于半结构化和非结构化数据、高并发及大数据场景,如社交网络。选择时应考虑业务需求、技术栈、团队经验和成本效益,以找到最佳解决方案。随着技术发展,NewSQL和Multi-model数据库也提供了更多选择。
901 0
|
机器学习/深度学习 算法 计算机视觉
深度学习目标检测系列:一文弄懂YOLO算法|附Python源码
本文是目标检测系列文章——YOLO算法,介绍其基本原理及实现细节,并用python实现,方便读者上手体验目标检测的乐趣。
54679 0
|
机器学习/深度学习 编解码 监控
目标检测实战(六): 使用YOLOv8完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
这篇文章详细介绍了如何使用YOLOv8进行目标检测任务,包括环境搭建、数据准备、模型训练、验证测试以及模型转换等完整流程。
24212 59
目标检测实战(六): 使用YOLOv8完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
|
机器学习/深度学习 人工智能 算法
目标检测技术研究现状及发展趋势
随着人工智能、深度学习技术的快速发展,受到深度学习在自然场景图像目标检测中的成功应用的影响,许多学者尝试将深度学习方法应用于图像的目标检测中,基于卷积神经网络的目标检测成为发展趋势。
2165 0
目标检测技术研究现状及发展趋势
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【损失函数篇】| WIoU v3:针对低质量样本的边界框回归损失函数
YOLOv11改进策略【损失函数篇】| WIoU v3:针对低质量样本的边界框回归损失函数
2126 6
|
数据处理 算法框架/工具 计算机视觉
手把手教你使用YOLOV5训练自己的目标检测模型
本教程由肆十二(dejahu)撰写,详细介绍了如何使用YOLOV5训练口罩检测模型,涵盖环境配置、数据标注、模型训练、评估与使用等环节,适合大作业及毕业设计参考。提供B站视频、CSDN博客及代码资源链接,便于学习实践。
5646 1
手把手教你使用YOLOV5训练自己的目标检测模型
|
机器学习/深度学习 人工智能 文字识别
ultralytics YOLO11 全新发布!(原理介绍+代码详见+结构框图)
本文详细介绍YOLO11,包括其全新特性、代码实现及结构框图,并提供如何使用NEU-DET数据集进行训练的指南。YOLO11在前代基础上引入了新功能和改进,如C3k2、C2PSA模块和更轻量级的分类检测头,显著提升了模型的性能和灵活性。文中还对比了YOLO11与YOLOv8的区别,并展示了训练过程和结果的可视化
23108 0
|
Java Maven
IDEA中查看源码点击Download Sources时出现Cannot download sources的问题复现及解决
IDEA中查看源码点击Download Sources时出现Cannot download sources的问题复现及解决
2489 0
|
机器学习/深度学习 编解码 算法
YOLOv8改进 | 主干网络 | 增加网络结构增强小目标检测能力【独家创新——附结构图】
YOLOv8在小目标检测上存在挑战,因卷积导致信息丢失。本文教程将原网络结构替换为更适合小目标检测的backbone,并提供结构图。通过讲解原理和手把手教学,指导如何修改代码,提供完整代码实现,适合新手实践。文章探讨了大特征图对小目标检测的重要性,如细节保留、定位精度、特征丰富度和上下文信息,并介绍了FPN等方法。YOLOv8流程包括预处理、特征提取、融合和检测。修改后的网络结构增加了上采样和concatenate步骤,以利用更大特征图检测小目标。完整代码和修改后的结构图可在文中链接获取。
10238 2
|
机器学习/深度学习 算法 Go
YOLOv5网络结构解析
YOLOv5网络结构解析

热门文章

最新文章