【Tied-Augment】卷出新花样:加强数据增强的有效性!从一篇顶刊论文中窥探的一些信息,

简介: 【Tied-Augment】卷出新花样:加强数据增强的有效性!从一篇顶刊论文中窥探的一些信息,

前言

  数据增强在深度学习中起着重要作用,并已成为训练模型的不可或缺的组成部分。通过对数据进行改变和扩充,数据增强可以提高模型的鲁棒性和泛化能力。然而,数据增强通常需要更多的训练周期才能发挥有效作用,尤其是在增强复杂性增加的情况下。此外,当神经网络和数据集变得越来越大时,计算资源的限制可能导致传统的数据增强方法失去效力。在调整预训练模型时,数据增强的效果可能不如从头开始训练时明显。

核心概要

  数据增强就是对我们已有的数据进行一些改变和扩充,以增加模型的鲁棒性和泛化能力。通过对数据进行变换、旋转、缩放等操作,我们可以生成更多的样本,使模型能够更好地理解和处理各种不同的情况。

  虽然在测试时不会造成额外的延迟,但进行数据增强通常需要更多的训练周期才能取得有效的结果。这是因为模型需要花更多的时间来学习各种不同的数据变化和情况,以提高其性能和准确度。 那么我们是否可以在训练策略上优化改进呢?对数据增强部分的使用加强利用,这便是这篇顶刊论文精髓所在。

  1. 我们表明,添加一个简单的损失项来调制特征相似性可以显著提高数据增强的有效性,我们展示了不同的数据增强集,如Crop-Flip, RandAugment和mixup。
  2. 与传统的数据增强方法不同,使用我们的框架,数据增强可以提高性能,即使只训练一个epoch用于微调预训练网络或从头开始训练具有不同架构的大范围数据集。
  3. 我们将tied - augment与多阶段自监督学习方法进行比较(首先是预训练,然后在ImageNet上进行微调)。我们提出的框架被设计成像传统的数据增强技术一样简单,同时避免了对额外组件的需求,如内存库、大批量、对比数据实例、延长的训练周期或大模型大小。尽管如此简单,但在ImageNet验证精度方面,tied - augment可以胜过更复杂的自监督学习方法。

image.png

实验数据支持

  在 CIFA R-10、CIFA R-100、CIFAR-4K和ImageNet数据集。我们把捆绑-增加和作物-翻转(CF)和随机pad(RA)基线。报告结果平均5次独立运行。标准偏差每个实验的结果小于或等于0.1%。

  在CIFAR上进行的少量划时代训练的测试准确度(%)数据集。报告的结果是平均10次独立运行。对于1,2,5,10代,标准差小于0.5,0.3,0.2,分别为0.1和0.1。

image.png

  下表是斯坦福大学的精细实验--花102(花),宠物(宠物),FGVC飞机(飞机),CIFAR-10数据集。报告的2,5项结果10个迭代的实验是10次独立运行的平均值,剩下的是平均5次独立运行。 基线结果是标准训练和双重强化的最大限度。没有相似损失的分支。预先训练的模型是一个标准RESNET-50,平分-加法只用于融资.最佳CF(CF相对于绑定-CF)和RA(RA与绑定-RA)的结果是粗体的。 精度的标准偏差小于或等于。0.5%、0.4%、0.2%、0.1%和0.1%(2、5、10、25和50)分别为时代。

image.png

  下表是ImageNet结果。RESNET-200基线没有改进当训练超过180迭代的时候。标准偏差报告的结果小于或等于0.2%。

image.png


相关文章
【论文速递】NDSS2021 - 操纵 Byzantine: 联邦学习的模型中毒攻击与防御优化
【论文速递】NDSS2021 - 操纵 Byzantine: 联邦学习的模型中毒攻击与防御优化
|
8月前
|
SQL 机器学习/深度学习 开发框架
【网安AIGC专题10.25】8 CoLeFunDa华为团队:静默漏洞检测(识别+多分类)+数据增强、样本扩充+对比学习+微调+结果分析(降维空间,分类错误样本归纳,应用场景优势,有效性威胁分析)
【网安AIGC专题10.25】8 CoLeFunDa华为团队:静默漏洞检测(识别+多分类)+数据增强、样本扩充+对比学习+微调+结果分析(降维空间,分类错误样本归纳,应用场景优势,有效性威胁分析)
189 0
|
11月前
|
机器学习/深度学习 人工智能 安全
调查分析两百余篇大模型论文,数十位研究者一文综述RLHF的挑战与局限
调查分析两百余篇大模型论文,数十位研究者一文综述RLHF的挑战与局限
286 0
|
数据采集 机器学习/深度学习 人工智能
教科书级数据is all you need:1.3B小模型逆袭大模型的秘密
教科书级数据is all you need:1.3B小模型逆袭大模型的秘密
220 0
|
机器学习/深度学习 编解码 人工智能
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果(1)
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果
157 0
|
机器学习/深度学习
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果(2)
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果
134 0
|
机器学习/深度学习 算法
信息瓶颈提出者Naftali Tishby生前指导,129页博士论文「神经网络中的信息流」公布
信息瓶颈提出者Naftali Tishby生前指导,129页博士论文「神经网络中的信息流」公布
107 0
|
机器学习/深度学习 算法 机器人
CMU发表新型灵巧机器人算法,准确学习日常家具的操纵方法
CMU发表新型灵巧机器人算法,准确学习日常家具的操纵方法
|
机器学习/深度学习 人工智能 运维
ECCV 2022 Oral | 无需微调即可推广,上交大、上海人工智能实验室等提出基于配准的少样本异常检测框架
ECCV 2022 Oral | 无需微调即可推广,上交大、上海人工智能实验室等提出基于配准的少样本异常检测框架
111 0
|
机器学习/深度学习 算法 安全
CVPR 2022 | 联邦学习审计隐私新手段,田纳西大学等提出生成式梯度泄露方法GGL
CVPR 2022 | 联邦学习审计隐私新手段,田纳西大学等提出生成式梯度泄露方法GGL
183 0