AAAI 2021 | 华为诺亚方舟实验室AI&上交大叶南阳提出算法DecAug,面向多维度非独立同分布域泛化问题

简介: 华为诺亚方舟实验室AI理论团队和上海交通大学叶南阳联合提出一种面向多维度非独立同分布域泛化问题的算法DecAug 。

华为诺亚方舟实验室AI理论团队和上海交通大学叶南阳联合提出一种面向多维度非独立同分布域泛化问题的算法DecAug 《DecAug: Out-of-Distribution Generalization via Decomposed Feature Representation and Semantic Augmentation》,已在AAAI 2021 (论文地址: https://arxiv.org/pdf/2012.09382)发表。


该工作首次将此前联系较少的数个领域,如Domain generalization, stable learning, causal inference统一在Out-of-Distribution (OoD) 的问题背景下,揭示了机器学习中受到广泛关注的不同领域方向的内在联系,提出了第一种同时在几个领域都取得SOTA性能的方法。


研究背景


传统的机器学习算法,通常假设训练样本和测试样本来自同一概率分布 Independent and Identically Distributed (IID)。但是对于 Out-of-Distribution (OoD)场景,即训练样本的概率分布和测试样本的概率分布不同的情况,训练出的模型很难在目标域取得良好的表现。如何设计出一种通用的OoD泛化框架是一项具有挑战性的任务,这主要是由于在现实生活中广泛存在的correlation shift和diversity shift问题。大多数以前的方法只能处理单一维度的OoD问题,例如跨域偏移或相关性外推,这限制了其在实际场景中的广泛应用。

90.jpg


图1:不同的数据集存在两种维度OoD问题:Correlation shift 和 Diversity shift。实验表明现有的许多OoD算法只能处理好单一维度的OoD问题。


因此,本文提出了基于特征分解和语义增广的方法DecAug,来处理多维度非独立同分布数据的问题,同时可以泛化到未知目标域的情况。具体地,首先在特征层面分解高维表征,基于损失函数梯度正交的正则化方式分解类别相关与语境相关的高维向量。针对语境相关的特征,利用基于梯度的增广机制,在特征层面生成新语境的样本,从而增强模型的域泛化性能。


方法概述

91.jpg

图2:DecAug框架:输入的图片首先通过骨干网络提取特征,基于损失函数梯度正交的正则化方式,高维表征被分解为类别相关和语境相关的两个分支。基于梯度的语义增广机制作用于语境相关分支,在特征层面生成新语境样本。


特征分解:


92.png

数据增广:


DecAug针对语境相关特征进行数据增广的操作来减轻分布偏差带来的影响。在语义特征空间存在着多个不同的分布偏差方向。为了确保在不同的环境中都有好的效果,本文针对OoD泛化的最差场景,通过在特征空间生成对抗扰动的样本来进行数据增广操作和训练模型。具体来说,DecAug对语境相关的特征进行语义增广操作:


93.png

随机梯度优化算法可以被用来优化所提到的目标函数。


实验验证


我们在公开数据集PACS,Colored MNIST和NICO上验证DecAug算法,对比其他的OoD generalization算法。


准确性:

94.jpg


从上图实验结果可以看出,相比于风险正则化方法(e.g., Rex, IRM) 以及典型的域泛化方法比如 (e.g., JiGen), 通过基于损失函数梯度正交的正则化方式以及语义增广机制,DecAug算法在不同数据集上均取得最优表现。


消融分析


95.png

上图展示了在PACS数据集上基于损失函数梯度正交正则化方式对模型的贡献度。without orth loss 表示不使用损失函数梯度正交,下面三行是不同的正则化强度。从结果可见,使用基于损失函数梯度正交的正则化方式可以带来OoD泛化性能的提升。


96.jpg

上图展示了DecAug在PACS数据集上不同变体的性能表现。可以看到,直接地融合DecAug 和DANN对抗损失,效果提升有限。另外,将正交正则化限制直接作用于特征,甚至可能带来负向提升。由此可见,DecAug的两分支结构及针对语境特征的对抗增广机制有助于提升模型的OoD泛化性能。


模型可视化:

97.jpg

上图可视化了两个分支的梯度注意力分布,考察模型的可解释性。第一行是在PACS数据集随机选出的4种类别8个图片,下面两行分别是对应的类别分支及语境分支的注意力。可以看到,类别分支注意力会更关注在前景部分,而语境分支会同时对包含域信息的不同背景语境敏感,说明DecAug有效分解了类别相关及语境相关的高维特征。


总结


本文提出了一种基于特征分解和语义增广面向多维度OoD泛化问题的模型DecAug。基于损失函数梯度正交的正则化方式,DecAug将输入数据在特征层面分解为类别相关及语境相关的特征,来处理训练数据与测试数据之间的分布偏差。基于梯度的语义增广机制作用于语境相关分支来提升模型的OoD泛化性能。DecAug在三个公开数据集上均呈现出比之前的基于风险最小化正则及传统域适应算法更好的OoD泛化性能。


相关文章
|
算法 数据处理 C++
【C++ 20 新特性 算法和迭代器库的扩展和泛化 Ranges】深入浅出C++ Ranges库 (Exploring the C++ Ranges Library)
【C++ 20 新特性 算法和迭代器库的扩展和泛化 Ranges】深入浅出C++ Ranges库 (Exploring the C++ Ranges Library)
1828 1
|
人工智能 搜索推荐
「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为
SocioVerse是由复旦大学联合小红书等机构开源的社会模拟框架,基于大语言模型和千万级真实用户数据构建,能精准模拟群体行为并预测社会事件演化趋势。
1032 2
「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为
|
7月前
|
机器学习/深度学习 人工智能 算法
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
本数据集包含2500张已标注实验室设备图片,涵盖空调、灭火器、显示器等10类常见设备,适用于YOLO等目标检测模型训练。数据多样、标注规范,支持智能巡检、设备管理与科研教学,助力AI赋能智慧实验室建设。
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
|
人工智能 自然语言处理 测试技术
阿里云通义实验室自然语言处理方向负责人黄非:通义灵码2.0,迈入 Agentic AI
在通义灵码 2.0 发布会上,阿里云通义实验室自然语言处理方向负责人黄非分享了代码大模型的演进。过去一年来,随着大模型技术的发展,特别是智能体技术的深入应用,通义灵码也在智能体的基础上研发了针对于整个软件研发流程的不同任务的智能体,这里既包括单智能体,也包括多智能体合并框架,在这样的基础上我们研发了通义灵码2.0。
1182 21
|
人工智能 编解码 BI
LEOPARD:腾讯AI Lab西雅图实验室推出的视觉语言模型
LEOPARD是由腾讯AI Lab西雅图实验室推出的视觉语言模型,专为处理含有大量文本的多图像任务设计。该模型通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,在多个基准测试中表现卓越,适用于自动化文档理解、教育和学术研究、商业智能和数据分析等多个应用场景。
490 2
LEOPARD:腾讯AI Lab西雅图实验室推出的视觉语言模型
|
人工智能 自然语言处理 测试技术
阿里云通义实验室自然语言处理方向负责人黄非:通义灵码2.0,迈入 Agentic AI
阿里云通义实验室自然语言处理方向负责人黄非:通义灵码2.0,迈入 Agentic AI
|
人工智能 架构师 大数据
广西广电X阿里云:共同成立全媒体AI实验室!
广西广电X阿里云:共同成立全媒体AI实验室!
560 5
|
算法 语音技术
支付宝商业化广告算法问题之在ODL模型优化过程中,采取什么策略来提高模型的泛化能力呢
支付宝商业化广告算法问题之在ODL模型优化过程中,采取什么策略来提高模型的泛化能力呢
235 1
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
434 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
存储 人工智能 文字识别
极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别
【2月更文挑战第17天】极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别
997 5
极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别

热门文章

最新文章