使用多类掩码区域的卷积神经网络对人和汽车的各个实例进行分段

简介: 使用多类掩码区域的卷积神经网络对人和汽车的各个实例进行分段。

一、前言
使用基于多类掩码区域的卷积神经网络 (R-CNN) 对人和汽车的各个实例进行分段。实例分割是一种计算机视觉技术,您可以在其中检测和定位对象,同时为每个检测到的实例生成分割图。
首先演示如何使用检测两个类的预训练掩码 R-CNN 执行实例分段。然后,您可以选择下载数据集并使用迁移学习训练多类掩码 R-CNN。
二、使用预训练掩码 R-CNN 执行实例分段
指定为预训练网络和数据的所需位置。下载预训练的掩码 R-CNN。读取包含目标类对象的测试图像。

使用 segmentObjects 函数分割对象及其掩码。该函数在执行预测之前对输入图像执行这些预处理步骤。segmentObjects 使用 COCO 数据集均值将图像定零。将图像大小调整为网络的输入大小,同时保持纵横比(信箱)。通过使用插入对象掩码函数在图像上叠加检测到的蒙版来可视化预测。显示对象上的边界框和标签。
1.png

三、下载训练数据
创建目录以存储 COCO 训练图像和注释数据。
COCO 2014 训练图像数据集 [2] 由 82,783 张图像组成。注释数据至少包含五个与每个图像对应的标题。分别单击“2014 Train Images”和“2014 Train/Val 注释”链接,从 https://cocodataset.org/#download 下载 COCO 2014 培训图像和说明。将图像文件解压缩到 指定的文件夹中。将批注文件解压缩到 指定的文件夹中。
四、读取和预处理训练数据
初始化训练数据参数,将 COCO 注释数据格式化为 MAT 文件。指定用于存储 MAT 文件的文件夹。创建数据存储。
掩码 R-CNN 期望输入数据为包含 RGB 训练图像、边界框、实例标签和实例掩码的 1×4 单元数组。

使用自定义读取函数 c 创建文件数据存储,该函数读取解压缩的注记 MAT 文件的内容,将灰度训练图像转换为 RGB,并以所需格式将数据作为 1 x 4 单元格数组返回。自定义读取函数作为支持文件附加到此示例。预览转换后的数据存储返回的数据。
五、创建掩膜 R-CNN 网络图层
Mask R-CNN建立在具有ResNet-50基础网络的Faster R-CNN之上。要在预训练的掩码 R-CNN 网络上传输学习,请使用该对象加载预训练网络,并为新的类集和输入大小自定义网络。默认情况下,对象使用的锚框与使用 COCO 数据集进行训练所用的锚框相同。
六、训练网络
指定 SGDM 优化选项,并训练网络 10 个周期。

目录
相关文章
|
6天前
|
机器学习/深度学习 数据采集 算法
Python基于OpenCV和卷积神经网络CNN进行车牌号码识别项目实战
Python基于OpenCV和卷积神经网络CNN进行车牌号码识别项目实战
41 19
|
6天前
|
机器学习/深度学习 编解码
深度之眼(二十八)——神经网络基础知识(三)-卷积神经网络
深度之眼(二十八)——神经网络基础知识(三)-卷积神经网络
28 14
|
2天前
|
机器学习/深度学习 PyTorch 算法框架/工具
图神经网络是一类用于处理图结构数据的神经网络。与传统的深度学习模型(如卷积神经网络CNN和循环神经网络RNN)不同,
图神经网络是一类用于处理图结构数据的神经网络。与传统的深度学习模型(如卷积神经网络CNN和循环神经网络RNN)不同,
15 9
|
14天前
|
监控 网络协议 安全
Socket网络编程中的常见应用场景与实例分析
Socket网络编程中的常见应用场景与实例分析
|
15天前
|
机器学习/深度学习 PyTorch 算法框架/工具
【YOLOv8改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
YOLO目标检测专栏介绍了SimAM,一种无参数的CNN注意力模块,基于神经科学理论优化能量函数,提升模型表现。SimAM通过计算3D注意力权重增强特征表示,无需额外参数。文章提供论文链接、Pytorch实现代码及详细配置,展示了如何在目标检测任务中应用该模块。
|
6天前
|
机器学习/深度学习 数据采集 算法
Python基于卷积神经网络CNN模型和VGG16模型进行图片识别项目实战
Python基于卷积神经网络CNN模型和VGG16模型进行图片识别项目实战
|
10天前
|
机器学习/深度学习 物联网 区块链
未来触手可及:探索区块链、物联网和虚拟现实的革新之路探索深度学习中的卷积神经网络(CNN)
随着科技的飞速发展,新兴技术如区块链、物联网(IoT)和虚拟现实(VR)正不断重塑我们的工作和生活方式。本文将深入探讨这些技术的最新发展趋势,分析它们如何在不同行业实现应用革新,并预测其未来的融合潜力。我们将从技术的基本原理出发,通过案例研究,揭示它们在现实世界中的创新应用场景,并讨论面临的挑战与机遇。 在机器学习领域,卷积神经网络(CNN)已成为图像识别和处理的基石。本文深入探讨了CNN的核心原理、架构以及在多个领域的应用实例,旨在为读者提供从理论到实践的全面理解。
|
12天前
|
网络协议 Linux 数据库
计算机网络知识之URL、IP、子网掩码、端口号
计算机网络知识之URL、IP、子网掩码、端口号
|
1月前
|
机器学习/深度学习
【从零开始学习深度学习】23. CNN中的多通道输入及多通道输出计算方式及1X1卷积层介绍
【从零开始学习深度学习】23. CNN中的多通道输入及多通道输出计算方式及1X1卷积层介绍
【从零开始学习深度学习】23. CNN中的多通道输入及多通道输出计算方式及1X1卷积层介绍
|
1月前
|
机器学习/深度学习 算法 计算机视觉
卷积神经网络(CNN)的工作原理深度解析
【6月更文挑战第14天】本文深度解析卷积神经网络(CNN)的工作原理。CNN由输入层、卷积层、激活函数、池化层、全连接层和输出层构成。卷积层通过滤波器提取特征,激活函数增加非线性,池化层降低维度。全连接层整合特征,输出层根据任务产生预测。CNN通过特征提取、整合、反向传播和优化进行学习。尽管存在计算量大、参数多等问题,但随着技术发展,CNN在计算机视觉领域的潜力将持续增长。