目标检测入门系列手册六:SSD训练教程

简介: 目标检测入门系列手册六:SSD训练教程

>>戳此处立即下载电子书<<,学习全套目标检测算法&模型

image.png

SSD

SSD[4] 同时借鉴了YOLO 网格的思想和Faster R-CNN 的anchor 机制,使得SSD 可以快速进行预测的同时又可以相对准确地获取目标的位置。

图2-15 中的(b)和(c)分别代表不同的特征层,(c)相对(b)离最终预测结果较近,因此跨越同样像素个数能检测的目标就越大。按照图2-15 所示,在特征层(b)的每个点上都将产生4 个不同大小的anchor(1:1 两个,1:2 两个),在特征层(c)上也是如此。因此,根据真实目标矩形框与每个anchor 的IOU 大小计算可知,(b)中有2 个anchor 为正样本,(c)中1 个anchor 为正样本。

image.png

图2-15 SSD 特征层与anchor 示意图[4]

对比之前学过的Faster R-CNN,接下来我们介绍SSD 的一些特点:

使用多尺度特征层进行检测。
在 Faster Rcnn 的 RPN 中,anchor 是在主干网络的最后一个特征层上生成的,而在SSD 中,anchor 不仅仅在最后一个特征层上产生,在几个高层特征层处同时也在产生anchor。如图2-16 所示,SSD 在VGG16 的conv6 开始,在conv7、conv8、conv9、conv10 都产生anchor。这些特征层大小依次递减,使得SSD 可以检测不同尺度的目标。这里简单解释下,比如同样一个3×3 的anchor,它在conv6 看到的目标(感受野)就要远小于conv10 看到的目标,可以理解为靠前的特征层用于检测小目标,而靠后的特征层用来检测大目标。与RPN 网络(2.2.3 中介绍)产生anchor 的方法类似,SSD 也是在特征层的每个点上产生多个比例、多个尺度的n 个anchor。如图2-15(b)是一个8×8 的特征层,每个小方格子是一个特征点,每个特征点上可以产生宽高比为1:1,1:2,1:3,大小多个尺度的anchor。

image.png

图2-16 SSD 结构图[4]

SSD 中所有特征层产生的 anchor 都将经过正负样本的筛选(在 2.2.3 介绍过如何使用IOU 进行anchor 的筛选)后直接进行分类分数以及bbox 位置的学习。
也就是说,特征层上生成的正负样本直接进行最终的分类(ClassNum 个类别)以及bbox 的学习,不像Faster R-CNN 那样先在第一步学是否有物体(只有0/1 两个类别)和bbox 位置,然后在第二步学最终的分类(ClassNum个类别)以及对bbox 位置的微调。

实际应用时我们往往不仅关注精度,很多情况下也要考虑速度,比如对视频内容进行实时地检测,这时候我们就希望有方法可以很好的做速度和精度的平衡。YOLO是第一个提出来效果很好的1-stage 检测方法,SSD 借鉴了它的一些思想并在其基础上做了改进,做到了比较好的平衡。

image.png

目录
相关文章
|
3月前
|
算法 开发者 Python
2025年高教社杯B题——碳化硅外延层厚度的确定全国大学生数学建模(思路、代码、论文)
2025年高教社杯B题——碳化硅外延层厚度的确定全国大学生数学建模(思路、代码、论文)
273 0
|
9月前
|
存储 安全 测试技术
云计算应该掌握的八种用途
云计算通过互联网提供按需付费的云服务,广泛应用于软件开发、社交网络、大数据分析、数据备份、文件存储、灾难恢复、云端通信和业务流程管理等领域。它帮助企业降低硬件成本、提高开发效率、保障数据安全、增强业务连续性,并支持多样化应用场景,成为数字化转型的核心引擎。
1924 2
|
10月前
|
人工智能 Java 程序员
一文彻底搞定电阻元件
电阻元件是限流器件,通过其电流与两端电压成正比(V=IR),阻值受温度、材料等影响。按特性分为线性与非线性,材料上有碳膜、金属膜等,用途涵盖限流、分压、偏置、滤波等。标称阻值有允许偏差,额定功率和最高工作电压需注意。色标法和直接读取法可用于识别阻值,万用表测量时需关闭电源并选择合适量程。电阻在电路设计中不可或缺,掌握其特性和应用对电子工程师至关重要。
732 0
一文彻底搞定电阻元件
|
监控 安全 网络安全
|
机器学习/深度学习 计算机视觉 Python
模型评估与选择:Sklearn中的交叉验证与网格搜索
【7月更文第23天】在机器学习项目中,模型的评估与选择是至关重要的步骤,它直接关系到模型的泛化能力和最终的应用效果。Scikit-learn(简称sklearn)作为Python中最受欢迎的机器学习库之一,提供了丰富的工具来进行模型调优和性能评估,其中交叉验证(Cross-Validation, CV)与网格搜索(Grid Search)是两个核心组件。本文将深入探讨这两项技术,并通过代码示例展示其在实践中的应用。
349 8
|
SQL 存储 分布式计算
神龙大数据加速引擎MRACC问题之RDMA技术帮助大数据分布式计算优化如何解决
神龙大数据加速引擎MRACC问题之RDMA技术帮助大数据分布式计算优化如何解决
693 0
|
机器学习/深度学习 人工智能 算法
人工智能(AI)、机器学习(ML)和深度学习(DL)
人工智能(AI)、机器学习(ML)和深度学习(DL)
436 1
|
移动开发 分布式数据库
"二叉树的性质与推导及常见习题整理 "
这篇内容介绍了二叉树的一些性质及其推导。
752 0
|
JavaScript 定位技术
vue 百度地图开发【教程】3. 自定义百度地图主题
vue 百度地图开发【教程】3. 自定义百度地图主题
352 0
|
小程序 前端开发 定位技术
微信小程序-常用的视图容器类组件
该内容是关于微信小程序组件的分类和部分具体组件的介绍。主要分为9大类:视图容器、基础内容、表单组件、导航组件、媒体组件、地图组件、画布组件、开放能力和无障碍访问。其中详细讲解了`view`、`scroll-view`、`swiper`及`swiper-item`等组件的用途和示例。`view`用于构建页面布局,`scroll-view`支持滚动效果,`swiper`则用于创建轮播图。此外,还提到了`root-portal`、`page-container`等其他特殊用途的组件。
341 0