目标检测技术研究现状及发展趋势

简介: 随着人工智能、深度学习技术的快速发展,受到深度学习在自然场景图像目标检测中的成功应用的影响,许多学者尝试将深度学习方法应用于图像的目标检测中,基于卷积神经网络的目标检测成为发展趋势。

     随着计算机设备的不断升级以及大规模数据集的建立,计算机视觉与深度学习技术得到快速发展,对图片视频数据的处理速度得到大幅提升。计算机设备通过接收图像数据,并利用深度学习算法,从而拥有了感知图像内容的能力。目前,通过将深度学习技术与计算机视觉技术相结合,产生了一系列变革与新应用,其中目标检测、识别技术成为了众多应用的关键技术之一。

      目标检测识别主要是对图片中的物品进行类别判断与定位。目标检测的发展如图 1 所示。传统的目标识别包括函数式判别方法,通过一组函数来描述计算过程,使得计算机在给定了输入数据后能够快速判别物品类型,然而在很多应用下,输入与输出之间对应的映射关系很难被发现,传统方法无法解决这种复杂的映射关系。因此,研究人员开始采用机器学习算法来计算输入输出的映射关系,增强了智能处理的能力,然而直接使用机械学习的算法在训练图像数据中,图像识别的正确度达不到预想的效果。针对此问题,研究人员采用特征提取算法,将图像对应的像素空间进行映射为特征空间,从而用特征向量对图像进行更本质的描述。

4[5F$I6D22WVD}]5}]`639M.png

    2012 年深度学习首次实现监督式训练深度卷积神经网络,Geoffrey Hinton 的研究团队通过利用基于 CNN 的 AlexNet 在 ImageNat 图像识别数据集上取得巨大成果,其创新点在于使用了 ReLU 激活函数,其特点是输入信号为正数输出不变,输入为负时,输出为 0,从而加速了收敛速度,这为目标识别技术的研究提供了强力解决方法。从此,计算机视觉很多方法都采用卷积神经网络作为特征提取的方法,深度学习的有监督学习也成为了主要的学习方向,随后一系列基于候选框与深度学习结合的算法被提出。利用区域推荐的方法,首先通过 CNN 网络生成候选框,对这些候选框进行分类与去重,该类算法包括 2014 年提出的 R-CNN 和Fast R-CNN以及2015年提出的Faster R-CNN,其中R-CNN,采用了AlexNet获取图像的特征向量,Faster R-CNN 是对 R-CNN、Fast R-CNN 的性能的改善,采用 ResNet网络提取卷积特征,使用区域生成网络(RPN)来推荐候选区域以提升检测框的生成,并将 RPN 与 Fast R-CNN 进行耦合,实现了 end to end 的目标识别网络,使得目标检测性能有了大的提高。随着对目标识别检测精度要求的提高,基于深度学习的回归方法被提出,该算法在检测过程可以一步得出待识别物体类型以及所在图像的位置坐标值,如 2015 年首次被 Joseph Redmon 等人提出的YOLO,2016 年提出的 SSD,相比较于 R-CNN 系列有着更好的检测速度。之后Joseph Redmon 团队又相继提出 YOLOv2,YOLOv3。2020年YOLOv4,YOLOv5 又相继被提出。

目录
打赏
0
0
0
0
30
分享
相关文章
目标检测的国内外研究现状
作为计算机领域的一个重要的研究成果,深度卷积神经网络已经广泛用于图像分类问题。随着图像分类的准确度提高,基于卷积神经网络的图像目标检测算法已逐渐成为当前的研究热点。
5997 0
康奈尔大学王飞: 医学人工智能真正落地面临的三大挑战
新智元AI WORLD2017 世界人工智能大会上,康奈尔大学威尔医学院助理教授王飞带来 《人工智能与智慧医疗》的演讲。他以一些研究上的实例,探讨了临床数据分析领域遇到的问题和成果,以及医学数据的质量、数据量和数据标准,模型推广性、可解释性、适用性,数据和模型的隐私性等方面的挑战。
2588 0
【AI影像见分水岭,行业面临洗牌】中美医学影像人工智能前沿峰会干货集锦
随着国家关于人工智能和大数据国家战略扶持措施的相继落地,这一轮AI角逐将很快出现分水岭,医学影像AI可能迎来洗牌,高下很快有结果。由汇医慧影和斯坦福大学医学院Department of Radiation Oncology AI Lab联合发起的“中美医学影像人工智能前沿峰会”于12月2日-3日在美国硅谷召开,针对医学影像创新和AI场景落地以及AI临床需求融合问题进行深入探讨。
2532 0

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等