正文
人工智能三要素
数据、算法、算力,是人工智能的三要素。优秀的深度学习算法能降低深度学习的难度,减少最终模型训练所需要的时间;强大的算力是当前越来越深的深度学习网络的支撑;算法,算力都很高大上,但最困难的地方还是数据的收集和标注。
数据的收集和标注
数据的收集和标注
上图是初次接触人工智能这块时,为了训练深度学习模型,人工做的图片收集和标注的工作,从百度、必应、Google图库里扒(下载)下来的,人眼去一张图片一张图片的检查图片里对应的飞机是不是都是一个类别的。
数据和数据的特征决定了深度学习的上限,算力是支撑,而模型和算法只是逼近这个上限而已。很多时候决定深度学习最终模型的准确率的还是数据集的优劣。
不得不说的数据增强
1.几何变换:
可以丰富物体在图像中出现的位置和尺度等,从而满足模型的平移不变性与尺度不变性,例如平移、翻转、缩放和裁剪等操作。尤其是水平翻转 180°,在多个物体检测算法中都有使用,效果很好。
2.光学变换:
可以增加不同光照和场景下的图像,典型操作有亮度、对比度、色相与饱和度的随机扰动、通道色域之间的变换等。
3.增加噪声:
通过在原始图像上增加一定的扰动,如高斯噪声,可以使模型对可能要的噪声等自然扰动产生鲁棒性,从而提升模型的泛化能力。需要注意噪声不能过大,一面影响模型的输出。
4.数据源头:
有时为了扩充数据集,可以将检测物体与其他图像融合,通过替换物体背景的方式来增加数据集的丰富性。
数据增强带来的好处
数据增强不仅可以防止模型的过拟合,对于模型的检测性能也通常会有较大的提升。