【计算机视觉】目标检测中Faster R-CNN、R-FCN、YOLO、SSD等算法的讲解(图文解释 超详细必看)

简介: 【计算机视觉】目标检测中Faster R-CNN、R-FCN、YOLO、SSD等算法的讲解(图文解释 超详细必看)

觉得有帮助请点赞关注收藏~~~

一、基于候选区域的目标检测算法

基于候选区域的深度卷积神经网络(Region-based Convolutional Neural Networks)是一种将深度卷积神经网络和区域推荐相结合的物体检测方法,也可以叫做两阶段目标检测算法。第一阶段完成区域框的推荐,第二阶段是对区域框进行目标识别。

1:Faster R-CNN目标检测算法

利用选择性搜索算法在图像中提取数千个候选区域,然后利用卷积神经网络对每个候选区域进行目标特征的提取,接着用每个候选区域提取到的特征来训练支持向量机分类器对候选区域进行分类,最后依据每个区域的分类得分使用非极大值抑制算法和线性回归算法优化出最红的目标位置。R-CNN算法的训练被分成多个阶段,包括分开训练提取特征的卷积神经网络,用于分类的分类器和分类器的训练不相关,这影响了目标检测的准确率。

Faster R-CNN方法中最重要的是使用候选区域推荐网络获得准确的候选区域框,大大加快了目标检测速度,并且将选择区域框的过程嵌入卷积神经网络中,与网络共享卷积层的参数,从而提高网络的训练和测试速度,候选区域推荐网络的核心思想是使用卷积神经网络直接产生候选区域框,使用的方法本质上就是滑动窗口。

2:R-FCN目标检测算法

R-FCN方法的整体结构全部由卷积神经网络组成,为了给全卷积神经网络引入平移变化,用专门的卷积层构建了位置敏感分数地图,每一个空间敏感地图对感兴趣区域的相对空间位置的信息进行了编码,并插入感兴趣区域池化层来接受整合信息,用于监管这些分数地图,从而给卷积神经网络加入了平移变化。R-FCN 在与区域推荐网络共享的卷积层后面多增加了1个卷积层,最后1个卷积层的输出从整幅图像的卷积响应图像中分割出感兴趣区域的卷积响应图像,R-FCN最后1个卷积层在整幅图像上为每类生成k的平方个位置敏感分数图

二、基于回归的目标检测算法

目前在深度卷积神经网络的物体检测方面,Faster R-CNN是应用比较广泛的检测方法之一,但是由于网络结构参数的计算量大,导致其检测速度慢,从而不能达到某些应用领域对于实时检测的要求。尤其对于嵌入式系统,所需要的计算时间太长。同样,许多方法都是以牺牲检测精度为代价来换取检测速度,为了解决精度与速度并存的问题,YOLO与SSD的方法应运而生,此类方法使用基于回归方法的思想,直接在输入图像的多个位置中回归出这个位置的区域框坐标和物体类别。

1:YOLO目标检测算法

YOLO是端到端的物体检测深度卷积神经网络,与Faster R-CNN的区别在于YOLO一次性预测多个候选框,并直接在输出层回归物体位置区域和区域内物体所属类别,YOLO最大的优势就是速度快,可满足端到端训练和实时检测要求

YOLO方法的物体检测过程为:首先将输入的图像划分成7×7个小网格,在每个小网格子里预测出2个区域框,从而可在整张图像上预测2×7×7个目标物体的区域框,利用交并比衡量这些区域框与图像上的真实区域框的差距,得到可能性高的候选区域框,最后使用非极大值抑制去掉这多余的区域框,YOLO整体训练方法过程较为简单,不需要中间的推荐区域步骤,直接通过网络回归完成物体的定位与分类,但是精度较差

2:SSD目标检测算法

SSD获取目标位置和类别的方式与YOLO方法类似,而相比与YOLO是在整张特征图上划分的7×7的网格内回归,YOLO对于目标物体的定位并不精确,所以为了解决精确问题,SSD利用类似Faster R-CNN推荐区域得分机制实现精确定位,与Faster R-CNN的推荐候选框得分机制不同,SSD在多个特征图上进行处理,SSD利用得分机制直接进行分类和区域框回归,在保证速度的同时,SSD检验结果的精度与Faster R-CNN相差不多,从而能够满足实时检测与高精度的要求

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
5天前
|
机器学习/深度学习 算法 安全
FRCNN来袭 | Faster RCNN与FCN永不遗忘,联邦学习+边缘数据既保护隐私也提升性能
FRCNN来袭 | Faster RCNN与FCN永不遗忘,联邦学习+边缘数据既保护隐私也提升性能
77 0
|
5天前
|
算法 搜索推荐 图计算
图计算中的社区发现算法是什么?请解释其作用和常用算法。
图计算中的社区发现算法是什么?请解释其作用和常用算法。
34 0
|
3天前
|
算法
MATLAB|【免费】融合正余弦和柯西变异的麻雀优化算法SCSSA-CNN-BiLSTM双向长短期记忆网络预测模型
这段内容介绍了一个使用改进的麻雀搜索算法优化CNN-BiLSTM模型进行多输入单输出预测的程序。程序通过融合正余弦和柯西变异提升算法性能,主要优化学习率、正则化参数及BiLSTM的隐层神经元数量。它利用一段简单的风速数据进行演示,对比了改进算法与粒子群、灰狼算法的优化效果。代码包括数据导入、预处理和模型构建部分,并展示了优化前后的效果。建议使用高版本MATLAB运行。
|
5天前
|
机器学习/深度学习 算法 数据可视化
YOLO系列算法全家桶——YOLOv1-YOLOv9详细介绍 !!(二)
YOLO系列算法全家桶——YOLOv1-YOLOv9详细介绍 !!(二)
47 3
|
5天前
|
机器学习/深度学习 算法 数据挖掘
YOLO系列算法全家桶——YOLOv1-YOLOv9详细介绍 !!(一)
YOLO系列算法全家桶——YOLOv1-YOLOv9详细介绍 !!(一)
41 1
|
5天前
|
机器学习/深度学习 传感器 编解码
Hy-Tracker来啦 | 带有YOLO的跟踪算法家族再添新成员,尺度变化和遮挡都不是问题!
Hy-Tracker来啦 | 带有YOLO的跟踪算法家族再添新成员,尺度变化和遮挡都不是问题!
85 1
|
5天前
|
机器学习/深度学习 数据可视化 定位技术
PrObeD方法开源 | 主动方法助力YOLOv5/Faster RCNN/DETR在COCO/GOD涨点
PrObeD方法开源 | 主动方法助力YOLOv5/Faster RCNN/DETR在COCO/GOD涨点
41 0
|
5天前
|
机器学习/深度学习 编解码 算法
中科大提出PE-YOLO | 让YOLO家族算法直击黑夜目标检测
中科大提出PE-YOLO | 让YOLO家族算法直击黑夜目标检测
62 0
|
5天前
|
算法 搜索推荐 Java
图计算中的PageRank算法是什么?请解释其作用和计算原理。
图计算中的PageRank算法是什么?请解释其作用和计算原理。
31 0
|
5天前
|
算法 搜索推荐 Java
图计算中的图剪枝算法是什么?请解释其作用和常用方法。
图计算中的图剪枝算法是什么?请解释其作用和常用方法。
16 0