目标检测技术研究现状及发展趋势

简介: 随着人工智能、深度学习技术的快速发展,受到深度学习在自然场景图像目标检测中的成功应用的影响,许多学者尝试将深度学习方法应用于图像的目标检测中,基于卷积神经网络的目标检测成为发展趋势。

     随着计算机设备的不断升级以及大规模数据集的建立,计算机视觉与深度学习技术得到快速发展,对图片视频数据的处理速度得到大幅提升。计算机设备通过接收图像数据,并利用深度学习算法,从而拥有了感知图像内容的能力。目前,通过将深度学习技术与计算机视觉技术相结合,产生了一系列变革与新应用,其中目标检测、识别技术成为了众多应用的关键技术之一。

      目标检测识别主要是对图片中的物品进行类别判断与定位。目标检测的发展如图 1 所示。传统的目标识别包括函数式判别方法,通过一组函数来描述计算过程,使得计算机在给定了输入数据后能够快速判别物品类型,然而在很多应用下,输入与输出之间对应的映射关系很难被发现,传统方法无法解决这种复杂的映射关系。因此,研究人员开始采用机器学习算法来计算输入输出的映射关系,增强了智能处理的能力,然而直接使用机械学习的算法在训练图像数据中,图像识别的正确度达不到预想的效果。针对此问题,研究人员采用特征提取算法,将图像对应的像素空间进行映射为特征空间,从而用特征向量对图像进行更本质的描述。

4[5F$I6D22WVD}]5}]`639M.png

    2012 年深度学习首次实现监督式训练深度卷积神经网络,Geoffrey Hinton 的研究团队通过利用基于 CNN 的 AlexNet 在 ImageNat 图像识别数据集上取得巨大成果,其创新点在于使用了 ReLU 激活函数,其特点是输入信号为正数输出不变,输入为负时,输出为 0,从而加速了收敛速度,这为目标识别技术的研究提供了强力解决方法。从此,计算机视觉很多方法都采用卷积神经网络作为特征提取的方法,深度学习的有监督学习也成为了主要的学习方向,随后一系列基于候选框与深度学习结合的算法被提出。利用区域推荐的方法,首先通过 CNN 网络生成候选框,对这些候选框进行分类与去重,该类算法包括 2014 年提出的 R-CNN 和Fast R-CNN以及2015年提出的Faster R-CNN,其中R-CNN,采用了AlexNet获取图像的特征向量,Faster R-CNN 是对 R-CNN、Fast R-CNN 的性能的改善,采用 ResNet网络提取卷积特征,使用区域生成网络(RPN)来推荐候选区域以提升检测框的生成,并将 RPN 与 Fast R-CNN 进行耦合,实现了 end to end 的目标识别网络,使得目标检测性能有了大的提高。随着对目标识别检测精度要求的提高,基于深度学习的回归方法被提出,该算法在检测过程可以一步得出待识别物体类型以及所在图像的位置坐标值,如 2015 年首次被 Joseph Redmon 等人提出的YOLO,2016 年提出的 SSD,相比较于 R-CNN 系列有着更好的检测速度。之后Joseph Redmon 团队又相继提出 YOLOv2,YOLOv3。2020年YOLOv4,YOLOv5 又相继被提出。

相关文章
|
机器学习/深度学习 人工智能 算法
目标检测的国内外研究现状
作为计算机领域的一个重要的研究成果,深度卷积神经网络已经广泛用于图像分类问题。随着图像分类的准确度提高,基于卷积神经网络的图像目标检测算法已逐渐成为当前的研究热点。
6505 0
|
机器学习/深度学习 算法 计算机视觉
深度学习目标检测系列:一文弄懂YOLO算法|附Python源码
本文是目标检测系列文章——YOLO算法,介绍其基本原理及实现细节,并用python实现,方便读者上手体验目标检测的乐趣。
54698 0
|
机器学习/深度学习 Shell 开发工具
Shell脚本编程实践——第1关:编写一个脚本,求斐波那契数列的前10项及总和
Shell脚本编程实践——第1关:编写一个脚本,求斐波那契数列的前10项及总和
2284 0
|
算法 计算机视觉 异构计算
目标检测的Tricks | 【Trick7】数据增强——Mosaic(马赛克)
目标检测的Tricks | 【Trick7】数据增强——Mosaic(马赛克)
3712 0
目标检测的Tricks | 【Trick7】数据增强——Mosaic(马赛克)
|
机器学习/深度学习 开发框架 .NET
YOLOv5的Tricks | 【Trick6】学习率调整策略(One Cycle Policy、余弦退火等)
YOLOv5的Tricks | 【Trick6】学习率调整策略(One Cycle Policy、余弦退火等)
4698 0
YOLOv5的Tricks | 【Trick6】学习率调整策略(One Cycle Policy、余弦退火等)
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【Head】| 引入RT-DETR中的RTDETRDecoder,替换检测头
YOLOv11改进策略【Head】| 引入RT-DETR中的RTDETRDecoder,替换检测头
1078 11
YOLOv11改进策略【Head】| 引入RT-DETR中的RTDETRDecoder,替换检测头
|
机器学习/深度学习 人工智能 文字识别
ultralytics YOLO11 全新发布!(原理介绍+代码详见+结构框图)
本文详细介绍YOLO11,包括其全新特性、代码实现及结构框图,并提供如何使用NEU-DET数据集进行训练的指南。YOLO11在前代基础上引入了新功能和改进,如C3k2、C2PSA模块和更轻量级的分类检测头,显著提升了模型的性能和灵活性。文中还对比了YOLO11与YOLOv8的区别,并展示了训练过程和结果的可视化
23151 0
|
机器学习/深度学习
YOLOv11改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
YOLOv11改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
1098 8
YOLOv11改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
|
XML 机器学习/深度学习 数据格式
YOLOv8训练自己的数据集+常用传参说明
YOLOv8训练自己的数据集+常用传参说明
24007 3
|
机器学习/深度学习 计算机视觉
【YOLOv8改进】MPDIoU:有效和准确的边界框损失回归函数 (论文笔记+引入代码)
YOLO目标检测专栏介绍了YOLO的有效改进和实战案例,包括卷积、主干网络、注意力机制和检测头的创新。提出了一种新的边界框回归损失函数MPDIoU,它基于最小点距离,能更好地处理不同宽高比的预测框,包含重叠、中心点距离和尺寸偏差的全面考虑。MPDIoU损失函数在YOLACT和YOLOv7等模型上的实验显示了优于现有损失函数的性能。此外,还介绍了WIoU_Scale类用于计算加权IoU,以及bbox_iou函数实现不同IoU变体的计算。详细实现和配置可在相应链接中查阅。

热门文章

最新文章