数据扩增的那些事

简介: 数据扩增的那些事

前言


  为了解决样本不足的情况下,我们往往会采用数据扩增提升数据数量,但是数量不能够一直无限制的提升,不然会导致样本容错空间不足,泛化误差高。下面为将分别讲解需要进行标签扩增与不需要进行标签扩增这两种方式。




不需要进行标签扩增


  不需要进行标签扩增是最为常见也是最为常见的一种数据扩增的方式,常见的扩增手段有如下几种:


  1. 改变图像的亮度(添加或降低)


  1. 对图像添加噪声(高斯、椒盐、随机)


  1. 改变图像对比度


  1. 对图像做锐化处理


  1. 对图像做滤波处理


  1. 对图像做模糊处理


  以上是不需要进行扩增标签的方式,不难发现上述扩增方法中,对于VOC数据来说,我们的目标在图像所在的位置并没有改变,因此扩增后的图像标签目标位置与源图像保持一致,我们只需要COPY源标签数据即可。




需要进行标签扩增


  上面我们介绍了不需要进行标签扩增的一些方法,然而上述的方法不能够很好的模拟目标在自然场景下的各种状态,因此我们还有一些改变图像目标位置的方法进行模拟,但是此类方法需要另外计算标签的偏移,大家在使用过程中需要稍加注意即可:


  1. 对图像进行仿射变换的旋转处理(仍然保持原图大小);


  1. 对图像进行镜像处理(同人照镜子一样);


  1. 对图像进行翻转处理(这里分为了左右翻转和上下翻转)


  1. 对图像做缩小拼接处理


  大家在做数据扩增的时候需要注意我们不能为了扩增而扩增,我们是为了能更好的模拟目标在自然环境下的状态下进行扩增处理,不能够因为扩增后改变了目标物的特性。



相关文章
|
供应链 芯片 Windows
计算机基础----32位操作系统和64位操作系统的区别
计算机基础----32位操作系统和64位操作系统的区别
460 0
计算机基础----32位操作系统和64位操作系统的区别
|
Android开发
Android系统移植与调试之------->build.prop生成过程分析
本文简要分析一下build.prop是如何生成的。Android的build.prop文件是在Android编译时刻收集的各种property(LCD density/语言/编译时间, etc.),编译完成之后,文件生成在out/target/product//system/目录下。
1458 0
|
机器学习/深度学习 算法 数据挖掘
【机器学习算法】9、EM算法与K-Means算法的收敛性证明
【机器学习算法】9、EM算法与K-Means算法的收敛性证明
638 0
|
4月前
|
SQL 数据可视化 BI
SQL语句及查询结果解析:技巧与方法
在数据库管理和数据分析中,SQL语句扮演着至关重要的角色
|
6月前
|
Prometheus 监控 Cloud Native
Grafana 入门指南:快速上手监控仪表盘
【8月更文第29天】Grafana 是一款开源的数据可视化和监控工具,它允许用户轻松地创建美观的仪表盘和图表,以便更好地理解和监控数据。无论您是需要监控系统性能指标、应用程序日志还是业务关键指标,Grafana 都能提供灵活而强大的解决方案。本指南将带领您快速上手 Grafana,包括安装、配置以及创建第一个监控面板。
1124 1
|
存储 前端开发 API
ES6的Set和Map你都知道吗?一文了解集合和字典在前端中的应用
下面的这篇文章中,将带领大家来一起了解集合和字典在前端中应用,并使用 Map 和 Set 来实现前端的一些常见场景。一起来学习吧~🙋‍♀️
ES6的Set和Map你都知道吗?一文了解集合和字典在前端中的应用
|
JavaScript
过滤器(filter)的基本使用 + 时间戳转化为相对日期过滤器代码封装
过滤器(filter)的基本使用 + 时间戳转化为相对日期过滤器代码封装
97 0
|
3天前
|
人工智能 自然语言处理 Shell
深度评测 | 仅用3分钟,百炼调用满血版 Deepseek-r1 API,百万Token免费用,简直不要太爽。
仅用3分钟,百炼调用满血版Deepseek-r1 API,享受百万免费Token。阿里云提供零门槛、快速部署的解决方案,支持云控制台和Cloud Shell两种方式,操作简便。Deepseek-r1满血版在推理能力上表现出色,尤其擅长数学、代码和自然语言处理任务,使用过程中无卡顿,体验丝滑。结合Chatbox工具,用户可轻松掌控模型,提升工作效率。阿里云大模型服务平台百炼不仅速度快,还确保数据安全,值得信赖。
146563 24
深度评测 | 仅用3分钟,百炼调用满血版 Deepseek-r1 API,百万Token免费用,简直不要太爽。
|
5天前
|
人工智能 API 网络安全
用DeepSeek,就在阿里云!四种方式助您快速使用 DeepSeek-R1 满血版!更有内部实战指导!
DeepSeek自发布以来,凭借卓越的技术性能和开源策略迅速吸引了全球关注。DeepSeek-R1作为系列中的佼佼者,在多个基准测试中超越现有顶尖模型,展现了强大的推理能力。然而,由于其爆火及受到黑客攻击,官网使用受限,影响用户体验。为解决这一问题,阿里云提供了多种解决方案。
16680 37
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
DeepSeek 系列模型以其卓越性能在全球范围内备受瞩目,多次评测中表现优异,性能接近甚至超越国际顶尖闭源模型(如OpenAI的GPT-4、Claude-3.5-Sonnet等)。企业用户和开发者可使用 PAI 平台一键部署 DeepSeek 系列模型,实现 DeepSeek 系列模型与现有业务的高效融合。

热门文章

最新文章