目标检测入门系列手册一:定位 + 分类问题的解法

简介: 目标检测入门系列手册一:定位 + 分类问题的解法

>>戳此处立即下载电子书<<,学习全套目标检测算法&模型

image.png

定位 + 分类问题是分类到目标检测的一个过渡问题,从单纯地图片分类到分类后给出目标所处位置,再到多目标的类别和位置。接下来,我们看一下定位+ 分类问题的解法。

image.png

分类不用多说,上一章我们以分类为例讲了卷积神经网络。在定位问题中,则需要模型返回目标所在的外接矩形框,即目标的(x,y,w,h)四元组。

接下来介绍一种比较容易想到的思路,把定位当做回归问题,具体步骤如下:

(1)训练(或下载)一个分类模型,例如AlexNet、VGGNet 或ResNet;

(2)在分类网络最后一个卷积层的特征层(feature map)上添加“regression head”,如图1-2 所示;补充说明:神经网络中不同的“head”通常用来训练不同的目标,每个“head”的损失函数和优化方向不同。如果想让一个网络实现多个功能,通常是在神经网络后面接多个不同功能的“head”。

(3)同时训练“classification head”和“regression head”,为了同时训练分类和定位(定位是回归问题)两个问题,最终损失函数是分类和定位两个“head”产生损失的加权和。

(4)在预测时同时使用分类和回归head 得到分类+ 定位结果。这里强调一下,分类预测出的结果就是C 个类别,回归预测的结果可能有两种:一种是类别无关,输出4个值;一种是类别相关,输出4*C 个值,这要看读者想要哪种结果了。

image.png


image.png

目录
相关文章
|
23天前
|
移动开发 算法 前端开发
前端常用算法全解:特征梳理、复杂度比较、分类解读与示例展示
前端常用算法全解:特征梳理、复杂度比较、分类解读与示例展示
20 0
|
28天前
|
机器学习/深度学习 编解码 计算机视觉
深度学习笔记(十一):各种特征金字塔合集
这篇文章详细介绍了特征金字塔网络(FPN)及其变体PAN和BiFPN在深度学习目标检测中的应用,包括它们的结构、特点和代码实现。
84 0
|
5月前
|
Web App开发 自然语言处理 算法
一文搞懂:【论文笔记】BINE:二分网络嵌入
一文搞懂:【论文笔记】BINE:二分网络嵌入
42 0
|
6月前
|
数据可视化 算法 PyTorch
贝叶斯优化实战(一)(3)
贝叶斯优化实战(一)
134 2
|
6月前
|
机器学习/深度学习 人工智能 算法
贝叶斯优化实战(一)(1)
贝叶斯优化实战(一)
290 0
贝叶斯优化实战(一)(1)
|
6月前
|
存储 数据可视化 大数据
贝叶斯优化实战(四)(5)
贝叶斯优化实战(四)
52 0
|
6月前
|
机器学习/深度学习 算法 数据可视化
贝叶斯优化实战(三)(3)
贝叶斯优化实战(三)
58 0
|
6月前
|
移动开发 数据可视化 算法
贝叶斯优化实战(二)(3)
贝叶斯优化实战(二)
84 0
|
6月前
|
机器学习/深度学习 移动开发 数据可视化
贝叶斯优化实战(一)(4)
贝叶斯优化实战(一)
161 0
|
6月前
|
机器学习/深度学习 存储 算法
贝叶斯优化实战(三)(2)
贝叶斯优化实战(三)
75 0