解决小目标检测常用手段——图像平铺

简介: 解决小目标检测常用手段——图像平铺

需求背景


  在日常的目标检测的任务中,我们常常会遇到小目标需要进行检测。这里的“小目标分“两类:


  1. 小目标可能是由目标距离摄像头距离较远导致目标成像的像素较小
  2. 可能是由于目标本身就小造成的。


  那么在进行目标检测的过程中,我们需要处理一些由于第一类造成的”小目标“进行检测,常用的一种手段就是图像平铺。(下述文章中,小目标即指由第一类原因造成的)。




如何制作


  在制作小目标数据集之前,我们肯定是会以原始数据集进行制作(假定我们的原始数据集图像大小为:1920x1080),这里以单张图像为例子进行思路流程讲解。


  我们拿到了一张原始图像以及xml标签文件,我们需要分别对img和xml进行处理,这里我将分开讲解。


处理img:


  1. 获取原始图像的size;


  1. 计算对原始图像的NewSize = size/3;


  1. 对原始图像进行resize处理(处理后的大小为NewSize);


  1. COPY9份数据为后面组成3x3网格数据做准备;


  1. 对COPY的每份数据可以进行不改变目标位置处理(例如:亮度、噪声和滤波);


  1. 拼接处理后的图像(拼接后的图像大小仍为size = (1920x1080))。


样图示例:

image.png


这样处理图像数据后我们不仅仅得到了小目标数据集,还对数据集进行了9倍的扩增同时也增加了数据的复杂度。



处理xml


  1. 读取xml文件;


  1. 解析xml中对应的img数据;


  1. 获取坐标并计算3x3网格中每一个目标的坐标;


  1. 对不同的坐标的label进行编写;


  1. 新建一个xml(同img名称)把数据写入。


注意事项: 这里需要注意的是当img中存在单个目标和多个目标进行解析的时候需要分类解析,这是两种不同的解析方法




后言


上述图像平铺的方法介绍到这里,经实验检测,具有一定的效果,后续改善化后,我再来告知大家。感谢大家阅读本文。



相关文章
|
8月前
|
编解码 计算机视觉
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-T !!! 最新的发文热点
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-T !!! 最新的发文热点
1169 7
YOLOv11改进策略【YOLO和Mamba】| 替换骨干 Mamba-YOLOv11-T !!! 最新的发文热点
|
算法 数据库 计算机视觉
Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
|
TensorFlow 算法框架/工具 Android开发
使用YOLOv5进行工业检测(如裂纹、划痕、破损等)
使用YOLOv5进行工业检测(如裂纹、划痕、破损等)
3499 1
|
7月前
|
API
有没有推荐的图生图大模型;自己本地部署,然后API实现传图生图
有没有推荐的图生图大模型;自己本地部署,然后API实现传图生图
513 0
|
JavaScript Java 开发工具
Electron V8排查问题之接近堆内存限制的处理如何解决
Electron V8排查问题之接近堆内存限制的处理如何解决
695 1
|
Web App开发 Ubuntu Linux
Linux无图形界面环境使用Python+Selenium实践
【5月更文挑战第1天】Linux无图形界面环境使用Python+Selenium实践
1177 2
|
机器学习/深度学习 计算机视觉 Python
YOLOv5改进系列(2)——添加CBAM注意力机制
YOLOv5改进系列(2)——添加CBAM注意力机制
10321 0
YOLOv5改进系列(2)——添加CBAM注意力机制
|
SQL 关系型数据库 数据库
SqlAlchemy 2.0 中文文档(四十三)(2)
SqlAlchemy 2.0 中文文档(四十三)
291 0
|
Web App开发 机器学习/深度学习 人工智能
详细解读AI测试之Applitools入门教程
详细解读AI测试之Applitools入门教程
665 0