前言
由于在实际项目应用中目标所在的位置会出现距离相机较远,而铁塔摄像头却不是经常使用较大的倍率焦距进行巡航,这个时候就会出现较小的目标时,我们在检测过程中会出现漏捡现象。
为了解决这一问题在这里提出了两种解决方案,但是在实际应用中我们往往采用方式2对数据进行处理。
- 修改网络结构感受野。这样的确是可以提高小目标的检测,但是却将网络偏向小目标检测上。
- 对数据进行缩小扩增,满足大目标的检测以及小目标的检测数据,在数据的整体分布上作出补充。
平铺扩增
在制作小目标数据集之前,我们肯定是会以原始数据集进行制作(假定我们的原始数据集图像大小为:1920x1080),这里以单张图像为例子进行思路流程讲解。
- 获取原始图像的size;
- 计算对原始图像的NewSize = size/3;
- 对原始图像进行resize处理(处理后的大小为NewSize);
- COPY9份数据为后面组成3x3网格数据做准备;
- 对COPY的每份数据可以进行不改变目标位置处理(例如:亮度、噪声和滤波);
- 拼接处理后的图像(拼接后的图像大小仍为size = (1920x1080))。
这样处理图像数据后我们不仅仅得到了小目标数据集,还对数据集进行了9倍的扩增同时也增加了数据的复杂度。
处理xml
- 读取xml文件;
- 解析xml中对应的img数据;
- 获取坐标并计算3x3网格中每一个目标的坐标;
- 对不同的坐标的label进行编写;
- 新建一个xml(同img名称)把数据写入。
拓展
(1)在模型设计方面,可以采用特征金字塔、沙漏结构等网络子结 构,来增强网络对多尺度尤其是小尺度特征的感知和处理能力;尽可能 提升网络的感受野,使得网络能够更多地利用上下文信息来增强检测效 果;同时减少网络总的下采样比例,使最后用于检测的特征分辨率更 高。
(2)在训练方面,可以提高小物体样本在总体样本中的比例;也可以 利用数据增强手段,将图像缩小以生成小物体样本。
(3)在计算量允许的范围内,可以尝试使用更大的输入图像尺寸。