前言
为了解决样本不足的情况下,我们往往会采用数据扩增提升数据数量,但是数量不能够一直无限制的提升,不然会导致样本容错空间不足,泛化误差高。下面为将分别讲解需要进行标签扩增与不需要进行标签扩增这两种方式。
不需要进行标签扩增
不需要进行标签扩增是最为常见也是最为常见的一种数据扩增的方式,常见的扩增手段有如下几种:
- 改变图像的亮度(添加或降低)
- 对图像添加噪声(高斯、椒盐、随机)
- 改变图像对比度
- 对图像做锐化处理
- 对图像做滤波处理
- 对图像做模糊处理
以上是不需要进行扩增标签的方式,不难发现上述扩增方法中,对于VOC数据来说,我们的目标在图像所在的位置并没有改变,因此扩增后的图像标签目标位置与源图像保持一致,我们只需要COPY源标签数据即可。
需要进行标签扩增
上面我们介绍了不需要进行标签扩增的一些方法,然而上述的方法不能够很好的模拟目标在自然场景下的各种状态,因此我们还有一些改变图像目标位置的方法进行模拟,但是此类方法需要另外计算标签的偏移,大家在使用过程中需要稍加注意即可:
- 对图像进行仿射变换的旋转处理(仍然保持原图大小);
- 对图像进行镜像处理(同人照镜子一样);
- 对图像进行翻转处理(这里分为了左右翻转和上下翻转)
- 对图像做缩小拼接处理
大家在做数据扩增的时候需要注意我们不能为了扩增而扩增,我们是为了能更好的模拟目标在自然环境下的状态下进行扩增处理,不能够因为扩增后改变了目标物的特性。