目标检测技术研究现状及发展趋势

简介: 随着人工智能、深度学习技术的快速发展,受到深度学习在自然场景图像目标检测中的成功应用的影响,许多学者尝试将深度学习方法应用于图像的目标检测中,基于卷积神经网络的目标检测成为发展趋势。

     随着计算机设备的不断升级以及大规模数据集的建立,计算机视觉与深度学习技术得到快速发展,对图片视频数据的处理速度得到大幅提升。计算机设备通过接收图像数据,并利用深度学习算法,从而拥有了感知图像内容的能力。目前,通过将深度学习技术与计算机视觉技术相结合,产生了一系列变革与新应用,其中目标检测、识别技术成为了众多应用的关键技术之一。

      目标检测识别主要是对图片中的物品进行类别判断与定位。目标检测的发展如图 1 所示。传统的目标识别包括函数式判别方法,通过一组函数来描述计算过程,使得计算机在给定了输入数据后能够快速判别物品类型,然而在很多应用下,输入与输出之间对应的映射关系很难被发现,传统方法无法解决这种复杂的映射关系。因此,研究人员开始采用机器学习算法来计算输入输出的映射关系,增强了智能处理的能力,然而直接使用机械学习的算法在训练图像数据中,图像识别的正确度达不到预想的效果。针对此问题,研究人员采用特征提取算法,将图像对应的像素空间进行映射为特征空间,从而用特征向量对图像进行更本质的描述。

4[5F$I6D22WVD}]5}]`639M.png

    2012 年深度学习首次实现监督式训练深度卷积神经网络,Geoffrey Hinton 的研究团队通过利用基于 CNN 的 AlexNet 在 ImageNat 图像识别数据集上取得巨大成果,其创新点在于使用了 ReLU 激活函数,其特点是输入信号为正数输出不变,输入为负时,输出为 0,从而加速了收敛速度,这为目标识别技术的研究提供了强力解决方法。从此,计算机视觉很多方法都采用卷积神经网络作为特征提取的方法,深度学习的有监督学习也成为了主要的学习方向,随后一系列基于候选框与深度学习结合的算法被提出。利用区域推荐的方法,首先通过 CNN 网络生成候选框,对这些候选框进行分类与去重,该类算法包括 2014 年提出的 R-CNN 和Fast R-CNN以及2015年提出的Faster R-CNN,其中R-CNN,采用了AlexNet获取图像的特征向量,Faster R-CNN 是对 R-CNN、Fast R-CNN 的性能的改善,采用 ResNet网络提取卷积特征,使用区域生成网络(RPN)来推荐候选区域以提升检测框的生成,并将 RPN 与 Fast R-CNN 进行耦合,实现了 end to end 的目标识别网络,使得目标检测性能有了大的提高。随着对目标识别检测精度要求的提高,基于深度学习的回归方法被提出,该算法在检测过程可以一步得出待识别物体类型以及所在图像的位置坐标值,如 2015 年首次被 Joseph Redmon 等人提出的YOLO,2016 年提出的 SSD,相比较于 R-CNN 系列有着更好的检测速度。之后Joseph Redmon 团队又相继提出 YOLOv2,YOLOv3。2020年YOLOv4,YOLOv5 又相继被提出。

相关文章
|
机器学习/深度学习 人工智能 算法
目标检测的国内外研究现状
作为计算机领域的一个重要的研究成果,深度卷积神经网络已经广泛用于图像分类问题。随着图像分类的准确度提高,基于卷积神经网络的图像目标检测算法已逐渐成为当前的研究热点。
6424 0
|
机器学习/深度学习 算法 计算机视觉
深度学习目标检测系列:一文弄懂YOLO算法|附Python源码
本文是目标检测系列文章——YOLO算法,介绍其基本原理及实现细节,并用python实现,方便读者上手体验目标检测的乐趣。
53356 0
|
算法 计算机视觉 异构计算
目标检测的Tricks | 【Trick7】数据增强——Mosaic(马赛克)
目标检测的Tricks | 【Trick7】数据增强——Mosaic(马赛克)
3308 0
目标检测的Tricks | 【Trick7】数据增强——Mosaic(马赛克)
|
机器学习/深度学习 Shell 开发工具
Shell脚本编程实践——第1关:编写一个脚本,求斐波那契数列的前10项及总和
Shell脚本编程实践——第1关:编写一个脚本,求斐波那契数列的前10项及总和
2212 0
|
9月前
|
机器学习/深度学习 存储
YOLOv11改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
YOLOv11改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
605 15
YOLOv11改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
|
9月前
|
机器学习/深度学习
YOLOv11改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
YOLOv11改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
748 8
YOLOv11改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
|
机器学习/深度学习 人工智能 文字识别
ultralytics YOLO11 全新发布!(原理介绍+代码详见+结构框图)
本文详细介绍YOLO11,包括其全新特性、代码实现及结构框图,并提供如何使用NEU-DET数据集进行训练的指南。YOLO11在前代基础上引入了新功能和改进,如C3k2、C2PSA模块和更轻量级的分类检测头,显著提升了模型的性能和灵活性。文中还对比了YOLO11与YOLOv8的区别,并展示了训练过程和结果的可视化
19859 0
|
机器学习/深度学习
一些关于Yolov5的改进点及实验结果(新增YOLOv5网络结构图)
一些关于Yolov5的改进点及实验结果(新增YOLOv5网络结构图)
一些关于Yolov5的改进点及实验结果(新增YOLOv5网络结构图)
|
机器学习/深度学习 文件存储 算法框架/工具
【YOLOv8改进- Backbone主干】2024最新轻量化网络MobileNetV4替换YoloV8的BackBone
YOLO目标检测专栏聚焦于模型的改进和实战应用,介绍了MobileNetV4,它在移动设备上优化了架构。文章提到了UIB(通用反向瓶颈)模块,结合了多种结构,增强了特征提取;Mobile MQA是专为移动平台设计的注意力层,提升了速度;优化的NAS提升了搜索效率。通过这些创新,MNv4在不同硬件上实现了性能和效率的平衡,且通过蒸馏技术提高了准确性。模型在Pixel 8 EdgeTPU上达到87%的ImageNet-1K准确率,延迟仅为3.8ms。论文、PyTorch和TensorFlow实现代码链接也已提供。
|
机器学习/深度学习 数据可视化 计算机视觉
YOLOv8改进 | 2023Neck篇 | 轻量级跨尺度特征融合模块CCFM(附yaml文件+添加教程)
YOLOv8改进 | 2023Neck篇 | 轻量级跨尺度特征融合模块CCFM(附yaml文件+添加教程)
1199 0