目标检测入门系列手册五:YOLO训练教程

简介: 目标检测入门系列手册五:YOLO训练教程

>>戳此处立即下载电子书<<,学习全套目标检测算法&模型

image.png

YOLO

由于在R-CNN 的系列算法中都需要首先获取大量proposal,但proposal 之间有很大的重叠,会带来很多重复的工作。YOLO[5] 一改基于proposal 的预测思路,将输入图片划分成SxS 个小格子,在每个小格子中做预测,最终将结果合并,如图2-14 所示。接下来我们看一下YOLO 学习的关键步骤:

(1)YOLO 对于网络输入图片的尺寸有要求,首先需要将图片缩放到指定尺寸(448x448),再将图片划分成SxS 的小格。

(2)每个小格里面做这几个预测:该小格是否包含物体、包含物体对应的矩形框位置以及该小格对应C 个类别的分数是多少。因此,每个小格需要预测的的维度为B x(1+4)+ C,其中B 代表每个小格最多可能交叠物体的个数,1 为该小格是否包含物体的置信度,4 用来预测矩形框,C 表示任务中所有可能的类别个数(不包含背景)。因此,YOLO 网络最终特征层的大小为 S x S x( Bx5 + C),图 2-14 中特征
层大小即为 7 x 7 x ( 2 x 5 + 20)=7x7x30(Pascal VOC2012 目标检测数据集共有20 种类别)。

由于YOLO 直接将输入图片划分为SxS 个小格,不需要产生proposal 的过程,所以速度比Faster R-CNN 快很多,但是因为粒度较粗,所以精度相比Faster R-CNN 略逊一筹。YOLO 的主要贡献是为目标检测提供了另一种思路,并使实时目标检测成为可能。近几年,YOLOv2 和YOLOv3 接连推出,感兴趣的读者可以参考附录的6。

image.png

图2-14 基于Pascal VOC2012 目标检测数据集的YOLO 示意图

image.png

目录
相关文章
|
9月前
|
编解码 缓存 并行计算
YOLOv5入门实践(4)——手把手教你训练自己的数据集
YOLOv5入门实践(4)——手把手教你训练自己的数据集
1061 0
YOLOv5入门实践(4)——手把手教你训练自己的数据集
|
25天前
|
机器学习/深度学习 PyTorch 测试技术
PyTorch实战:图像分类任务的实现与优化
【4月更文挑战第17天】本文介绍了使用PyTorch实现图像分类任务的步骤,包括数据集准备(如使用CIFAR-10数据集)、构建简单的CNN模型、训练与优化模型以及测试模型性能。在训练过程中,使用了交叉熵损失和SGD优化器。此外,文章还讨论了提升模型性能的策略,如调整模型结构、数据增强、正则化和利用预训练模型。通过本文,读者可掌握基础的PyTorch图像分类实践。
|
5月前
|
机器学习/深度学习 数据采集 PyTorch
PyTorch搭建卷积神经网络(ResNet-50网络)进行图像分类实战(附源码和数据集)
PyTorch搭建卷积神经网络(ResNet-50网络)进行图像分类实战(附源码和数据集)
100 1
|
5月前
|
机器学习/深度学习 PyTorch 算法框架/工具
PyTorch搭建卷积神经网络(CNN)进行视频行为识别(附源码和数据集)
PyTorch搭建卷积神经网络(CNN)进行视频行为识别(附源码和数据集)
45 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
PyTorch搭建图卷积神经网络(GCN)完成对论文分类及预测实战(附源码和数据集)
PyTorch搭建图卷积神经网络(GCN)完成对论文分类及预测实战(附源码和数据集)
163 1
|
9月前
|
XML 计算机视觉 数据格式
YOLOv5入门实践(2)——手把手教你利用labelimg标注数据集
YOLOv5入门实践(2)——手把手教你利用labelimg标注数据集
2935 0
YOLOv5入门实践(2)——手把手教你利用labelimg标注数据集
|
10月前
|
机器学习/深度学习 人工智能 计算机视觉
【YOLOv8】实战一:手把手教你使用YOLOv8实现实时目标检测
【YOLOv8】实战一:手把手教你使用YOLOv8实现实时目标检测
10297 0
【YOLOv8】实战一:手把手教你使用YOLOv8实现实时目标检测
|
11月前
|
机器学习/深度学习 PyTorch 算法框架/工具
pytorch实现卷积神经网络实验
pytorch实现卷积神经网络实验
181 0
|
机器学习/深度学习 人工智能 并行计算
PyTorch 深度学习实战 | 基于 ResNet 的花卉图片分类
本期将提供一个利用深度学习进行花卉图片分类的案例,并使用迁移学习的方法解决训练数据较少的问题。图片分类是根据图像的语义信息对不同的图片进行区分,是计算机视觉中的基本问题,也是图像检测、图像分割、物体跟踪等高阶视觉任务的基础。在深度学习领域,图片分类的任务一般基于卷积神经网络来完成,如常见的卷积神经网络有 VGG、GoogleNet、ResNet 等。而在图像分类领域,数据标记是最基础和烦琐的工作。有时由于条件限制,往往得不到很多经过标记的、用于训练的图片,其中一个解决办法就是对已经预训练好的模型进行迁移学习。 本文是以 ResNet 为基础,对花卉图片进行迁移学习,从而完成对花卉图片的分类任
382 0
PyTorch 深度学习实战 | 基于 ResNet 的花卉图片分类
|
算法 计算机视觉
【YOLO系列学习笔记】-第二章初识YOLO
you only look once,属于one-stage目标检测算法
62 0
【YOLO系列学习笔记】-第二章初识YOLO