目标检测网络R-CNN 系列

简介: 图像实例分割完成的是像素级的实例目标分割任务,是人工智能与计算机视觉领域的重要发展方向,其被广泛应用到各个领域,如工业生产、监控安防和医疗卫生等。目前的图像实例分割模型主要存在两个问题,第一,传统的图像实例分割模型由于图像中实例对象尺寸差异跨度较大,导致目标检测阶段出现误检、漏检等问题,从而使生成的掩码精度较低。第二,传统的实例分割模型在掩码生成阶段,主要是通过汇聚到全连接层的特征信息对像素点进行分类和归属判定。池化操作会导致特征图尺寸下降,在语义分割阶段,使传递给全连接层的特征信息有所丢失,进而导致像素点的类别归属出现偏差,生成的掩码质量低,实例边缘的细节信息不够精细化。

 R-CNN 系列目标检测网络,是深度学习在目标检测领域的首个系列网络,作为典型的 Two-Stage 目标检测网络。该系列包括 R-CNN、Fast R-CNN、Faster R-CNN,就像它们的名字一样,一代比一代速度快,主要是因为 Two-Stage 网络的特点就是精度高,速度慢。到 Faster R-CNN 网络时,就已经做到了端到端的全卷积目标检测网络。其作者 Ross Girshick 成为了 Facebook 的人工智能实验室(FAIR)的一员,即 Detectron2 平台的团队,还在不断为 R-CNN 系列算法的优化而努力。

(1)R-CNN

     R-CNN 目标检测网络,字母 R 代表 Region,即区域的意思,中文全称为区域卷积神经网络,是 2014 年出现的,是第一个出现在目标检测领域的深度学习算法,也是它掀起了深度学习在目标检测领域的新篇章,包括后面的 YOLO 等系列也是在此基础上出现的。R-CNN 的网络的结构逻辑如下图所示。

`X03MOX`NH[2~]8]OGCMYUA.png

R-CNN 网络处理数据的流程如下:

1)输入图像。

2)使用 selective search 的方法生成多个候选框。

3)将每个候选框输入到卷积层进行特征提取,卷积层网络常用 AlextNet、VGG。

4)再将第三步提取的特征输入到一个又一个类别的 SVM 分类器中进行判断,预测类别信息。

5)最后将经过分类的候选框做回归和修正,预测位置信息。

R-CNN 将深度学习带入检测领域后,PASCAL VOC 上的检测率大幅度提升,从35.1%提升到 53.7%。具备以下优点:

1)采用 CNN 的方式来提取特征,为视觉工作提供思路,只能靠人来考虑提取哪些特征的时代一去不复返了。

2)引入迁移学习的概念,即在大样本上的预训练模型,然后小样本时 fine-tune。

(2)Fast R-CNN

    继 R-CNN 推出之后,作者于 2015 年推出了 Fast R-CNN,优化了原本网络结构,提升了检测速度,降低了网络训练对空间的要求。其网络结构逻辑如下图所示。

5C(GIS6X4R$P7$)T2T@LEB5.png

Fast R-CNN 处理数据的流程如下:

1)输入图像。

2)使用 selective search 的方法生成多个候选框。

3)将整张图片输入到卷积层进行特征提取。

4)在卷积后的特征图上找到对应卷积前的候选框区域。

5)将对应的候选框区域经过 ROI Pooling 转换成固定大小的特征图。

6)将特征图输入到全连接层生成特征向量,用于分类和回归,分别得到分类信息和位置信息。

    Fast R-CNN 模型相较于 R-CNN 提升很大,训练时间缩短到原来的九分之一,测试时间缩短到原来的百分之一,测试精度还稍有提升,让人看到了 R-CNN 系列网络实现实时检测的可能。具备以下优点:

1)分类用 Soft max 代替了 SVM,并且采用分类和回归一起进行的方式,降低了训练及测试时长。

2)优化了网络结构,首先采用将整张图先输入到卷积神经网络再提取特征的方式,然后添加 RoI pooling 层使得最终的特征图尺寸一致,这样使得整个过程只需要一个全连接层,而且分类和回归也通过深度网络的方式实现,节约了内存需要。

(3)Faster R-CNN

     2015 年,何凯明团队再次提出新算法 Faster R-CNN,将候选框的生成也通过神经网络的方法实现,是第一个实现了端到端的目标检测网络,大大提高了检测速度,在当年的各大视觉竞赛中夺魁。其网络结构逻辑如下图所示。

NUDQ5Q)_HR4WI97Q_)}{ZNK.png

Faster R-CNN 处理数据的流程如下:

1)输入图像。

2)将整张图片输入到卷积层进行特征提取。

3)RPN 生成候选框。

4)在卷积后的特征图上找到对应卷积前的候选框区域。

5)将对应的候选框区域经过 ROI Pooling 转换成固定大小的特征图。

6)将特征图输入到全连接层生成特征向量,用于分类和回归,分别得到分类信息和位置信息。

    Faster R-CNN 目标检测网络无论在速度还是精度上,都得到大幅度提升,于当年的多个赛事中摘得桂冠。具备以下优点:

1)提出 Region Proposal Network(RPN)方法,用卷积神经网络的方式实现了候选框的生成,使网络实现端到端。

2)产生建议窗口的 CNN 和目标检测的 CNN 共享。

相关文章
|
10天前
|
机器学习/深度学习 TensorFlow 算法框架/工具
CNN构建网络
【8月更文挑战第10天】CNN构建网络。
45 22
|
24天前
|
机器学习/深度学习 计算机视觉 异构计算
【YOLOv8改进 - Backbone主干】ShuffleNet V2:卷积神经网络(CNN)架构
【YOLOv8改进 - Backbone主干】ShuffleNet V2:卷积神经网络(CNN)架构
|
24天前
|
编解码 Go 文件存储
【YOLOv8改进 - 特征融合NECK】 DAMO-YOLO之RepGFPN :实时目标检测的创新型特征金字塔网络
【YOLOv8改进 - 特征融合NECK】 DAMO-YOLO之RepGFPN :实时目标检测的创新型特征金字塔网络
|
10天前
|
机器学习/深度学习
CNN网络编译和训练
【8月更文挑战第10天】CNN网络编译和训练。
44 20
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
卷积神经网络(CNN):视觉识别的革命先锋
卷积神经网络(CNN)作为人工智能领域的一颗璀璨明珠,在计算机视觉中发挥着核心作用。CNN的发展历程展现了从生物学灵感到技术创新的转变,历经LeNet-5至AlexNet、VGGNet、ResNet等里程碑式的进步。其独特结构包括卷积层、池化层及全连接层,能够层层递进地提取特征并作出决策。CNN不仅在图像分类、目标检测等领域表现卓越,还在人脸识别、医学影像分析等方面展现出巨大潜力。尽管存在局限性,如对序列数据处理能力有限及解释性问题,但通过引入注意力机制、自监督学习等方法,CNN将持续演进,引领人工智能技术走向更加精彩的未来。
29 2
|
26天前
|
机器学习/深度学习 数据采集 监控
基于CNN卷积神经网络的步态识别matlab仿真,数据库采用CASIA库
**核心程序**: 完整版代码附中文注释,确保清晰理解。 **理论概述**: 利用CNN从视频中学习步态时空特征。 **系统框架**: 1. 数据预处理 2. CNN特征提取 3. 构建CNN模型 4. 训练与优化 5. 识别测试 **CNN原理**: 卷积、池化、激活功能强大特征学习。 **CASIA数据库**: 高质量数据集促进模型鲁棒性。 **结论**: CNN驱动的步态识别展现高精度,潜力巨大,适用于监控和安全领域。
|
24天前
|
机器学习/深度学习 计算机视觉
【YOLOv8改进 - 注意力机制】c2f结合CBAM:针对卷积神经网络(CNN)设计的新型注意力机制
【YOLOv8改进 - 注意力机制】c2f结合CBAM:针对卷积神经网络(CNN)设计的新型注意力机制
|
1月前
|
机器学习/深度学习 数据采集 算法
Python基于OpenCV和卷积神经网络CNN进行车牌号码识别项目实战
Python基于OpenCV和卷积神经网络CNN进行车牌号码识别项目实战
85 19
|
6天前
|
机器学习/深度学习 自然语言处理 算法
基于卷积神经网络(CNN)的垃圾邮件过滤方法
传统的垃圾邮件过滤手段如规则匹配常因垃圾邮件的多变而失效。基于深度学习的方法,特别是卷积神经网络(CNN),能自动学习邮件中的复杂特征,有效识别垃圾邮件的新形态。CNN通过特征学习、处理复杂结构、良好的泛化能力和适应性,以及高效处理大数据的能力,显著提升了过滤精度。在文本分类任务中,CNN通过卷积层提取局部特征,池化层减少维度,全连接层进行分类,特别适合捕捉文本的局部模式和顺序信息,从而构建高效的垃圾邮件过滤系统。
25 0
|
27天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于CNN卷积神经网络的MQAM调制识别matlab仿真
**理论**: 利用CNN自动识别MQAM调制信号,通过学习星座图特征区分16QAM, 64QAM等。CNN从原始数据提取高级特征,优于传统方法。 - **CNN结构**: 自动特征学习机制,适配多种MQAM类型。 - **优化**: 损失函数指导网络参数调整,提升识别准确度。 - **流程**: 大量样本训练+独立测试评估,确保模型泛化能力。 - **展望**: CNN强化无线通信信号处理,未来应用前景广阔。

热门文章

最新文章