【计算机视觉】数据获取、数据标注、数据增强的概念简介

简介: 【计算机视觉】数据获取、数据标注、数据增强的概念简介

觉得有帮助麻烦点赞关注收藏~~~

基于深度学习的视频分析算法是依赖于数据训练的,数据是深度学习的主要原料,对于算法性能的提升是非常重要的。本章将重点介绍数据的获取、标注、增强及处理方法。

一、数据获取

训练数据的来源主要包括网上公开数据库和自采数据库两种

网上公开数据库的优点在于数据类型全、标注比较规范,而缺点在于与实际的需求场景差距较大

自采数据库是根据项目需求自行采集的数据,根据需求完成数据标注。自采数据库的缺点是场景较为单一,移植性差等。

一般会采用公开数据库和自采数据库结合的方式完成数据训练

二、数据标注

下面主要介绍目标检测和图像分割的数据标注方法 以下两种软件都是开源软件,可以直接下载获取

1:目标检测与识别标注软件LabelImg

对于标注图像中目标需要借助标注软件LabelImg,该软件是一个专门为创建自己的数据集而研发的可视化图像标注软件,它由Python语言创建的,并调用QT制作图形界面,最后给出的标注信息与PASCAL VOC格式一致,最终保存成XML文件

2:图像分割软件LabelMe

图像分割样本的标注一般采用LabelMe软件,对于图像中车道线的标注采用LabelMe软件,与LaeblImg相比,它可以采用多个点来描述标注对象的外形,这在弯道中的车道线标注是很重要的功能,LabelMe的保存格式为json格式,训练时需要把它转化为图像标注格式(PNG格式的图片标签)

三、数据增强

训练数据数量的增加可以大大提高模型的泛化能力,所以在训练之前一般要进行数据增加,视觉模型的数据增强策略通常是针对特定的数据集或者特定的机器学习网络架构,例如进行模型训练时通常使用随机变换,变换的主要方式包括:传统的图像领域的数据增强技术是以仿射变化为基础的,例如旋转、缩放、平移等等,以及一些简单的图像处理手段,这些变换的前提是不改变图像的类别属性,并且只能局限在图像域,这种基于几何变换和图像操作的数据增强方法可以在一定程度上缓解神经网络过拟合的问题,提高泛化能力,但是与增加原始数据相比,增加的数据并没有从根本上解决数据不足的难题,同时这种数据增强方式需要人为设定转换函数和对应的参数,一般都是凭借经验知识,最优数据增强难以实现,所以模型的泛化性能提升有限,然而数据增强的另一种方法,图像合成可以使生成的图像更加真实,多样并满足输入条件,从真正意义上扩充了数据域,提升训练模型的鲁棒性

最近深度卷积神经网络的发展催生了很多深度图像合成模型,如变分自编码器,生成对抗网络,自回归模型等等,这些基于合成的方法相比传统的数据增强方法虽然过程更加复杂,通常都需要训练和学习,但是合成的样本更加多样和复杂,从真正意义上扩充了数据域

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
6月前
|
存储 机器学习/深度学习 编解码
计算机视觉的基础概念与入门
之前学习了一下 Python 环境下计算机视觉方面的一些应用(主要是 OpenCV),但是对于计算机视觉方面的种种概念都是一笔带过,计算机视觉是一个很大的领域,在深入它之前 ,有必要对其中的一些基础概念有一个宏观的理解。
|
6月前
|
机器学习/深度学习 XML 计算机视觉
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
|
8月前
|
机器学习/深度学习 人工智能 监控
【AI 初识】计算机视觉的概念
【5月更文挑战第3天】【AI 初识】计算机视觉的概念
|
8月前
|
机器学习/深度学习 计算机视觉 Python
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
227 0
|
8月前
|
机器学习/深度学习 传感器 自动驾驶
【计算机视觉】一、多任务深度学习网络的概念及在自动驾驶中的应用讲解(图文解释 超详细)
【计算机视觉】一、多任务深度学习网络的概念及在自动驾驶中的应用讲解(图文解释 超详细)
117 0
|
数据采集 XML 数据挖掘
计算机视觉PyTorch - 数据处理(库数据和训练自己的数据)
计算机视觉PyTorch - 数据处理(库数据和训练自己的数据)
130 1
|
机器学习/深度学习 编解码 人工智能
深度学习应用篇-计算机视觉-语义分割综述[6]:DeepLab系列简介、DeepLabV3深入解读创新点、训练策略、主要贡献
深度学习应用篇-计算机视觉-语义分割综述[6]:DeepLab系列简介、DeepLabV3深入解读创新点、训练策略、主要贡献
深度学习应用篇-计算机视觉-语义分割综述[6]:DeepLab系列简介、DeepLabV3深入解读创新点、训练策略、主要贡献
|
机器学习/深度学习 编解码 人工智能
深度学习应用篇-计算机视觉-图像增广1:数据增广、图像混叠、图像剪裁类变化类等详解
深度学习应用篇-计算机视觉-图像增广1:数据增广、图像混叠、图像剪裁类变化类等详解
深度学习应用篇-计算机视觉-图像增广1:数据增广、图像混叠、图像剪裁类变化类等详解
|
机器学习/深度学习 算法 自动驾驶
探索计算机视觉世界——OpenCV简介
探索计算机视觉世界——OpenCV简介
165 0
|
机器学习/深度学习 人工智能 监控
Landing AI:计算机视觉数据标注AI平台
Landing AI:计算机视觉数据标注AI平台
499 0

热门文章

最新文章