7 Papers & Radios | Bengio等用GFlowNets统一生成模型;首个黑箱防御框架

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 7 Papers & Radios | Bengio等用GFlowNets统一生成模型;首个黑箱防御框架

本周主要论文包括Bengio 等人用 GFlowNets 统一生成模型;清华 & Meta 提出 HorNet,用递归门控卷积进行高阶空间相互作用


目录

  1. Unifying Generative Models with GFlowNets
  2. Transformers in Remote Sensing: A Survey
  3. Efficient Methods for Natural Language Processing: A Survey
  4. Interactive Disentanglement: Learning Concepts by Interacting with their Prototype Representations
  5. MM-RealSR: Metric Learning based Interactive Modulation for Real-World Super-Resolution
  6. HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions
  7. How to Robustify Black-Box ML Models? A Zeroth-Order Optimization Perspective
  8. ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)


论文 1:Unifying Generative Models with GFlowNets


摘要:生成流网络(GFlowNets)是图灵奖得主 Yoshua Bengio 对 AI 领域未来方向提出的想法。灵感来源于信息在时序差分 RL 方法中的传播方式,两者都依赖于 credit assignment 一致性原则,它们只有在训练收敛时才能实现渐近。由于状态空间中的路径数量呈指数级增长,因此实现梯度的精确计算比较困难,因此,这两种方法都依赖于不同组件之间的局部一致性和一个训练目标,即如果所有学习的组件相互之间都是局部一致性的,那么我们就得到了一个系统,该系统可以进行全局估计。现在,Bengio 及其学生张鼎怀等发表了一篇新论文,简要介绍了现有深度生成模型与 GFlowNet 框架之间的联系,阐明了它们的重叠特征,并通过马尔可夫轨迹学习的视角提供了一个统一的观点,并进一步提供了一种统一训练和推理算法的方法。推荐:用 GFlowNets 统一生成模型,Bengio 等人数页论文给讲通了。论文 2:Transformers in Remote Sensing: A Survey


摘要:这篇综述论文涵盖了 60 多种最近基于 Transformer 的方法,用于解决遥感子领域中不同的遥感问题,包括超高分辨率 (VHR)、高光谱 (HSI) 和合成孔径雷达 (SAR) 图像。

最近遥感成像领域基于 Transformer 的技术概览。推荐:内容详实,方法全面,对于想要了解该领域的读者来说值得阅读。论文 3:Efficient Methods for Natural Language Processing: A Survey


摘要:这项综述论文涵盖了 NLP 高效方法的发现与实现,旨在指导该领域的新研究人员并激发新方法开发灵感。

高效 NLP 方法汇总。推荐:本文根据传统的 NLP pipeline 组织了现有文献,并对现有提高效率的方法及其缺点进行了广泛的概述。论文 4:Interactive Disentanglement: Learning Concepts by Interacting with their Prototype Representations


摘要:本文旨在通过弱监督和人机互动在原型离散的潜在空间上学习视觉概念。本文提出交互式概念交换网络(interactive Concept Swapping Networks, iCSNs),这是一个通过弱监督和隐性原型表征来学习以概念为基础的表征的新框架。这种以语义为基础的、离散的潜在空间有利于人类理解和人机互动。

交互式概念交换网络。

推荐:通过基于概念解释进行交互,被 CVPR 2022 会议接收。论文 5:MM-RealSR: Metric Learning based Interactive Modulation for Real-World Super-Resolution


摘要:最近无监督的对比学习在底层视觉领域受到越来越多的关注。这类方法方便了复杂降质特征的提取,这给来自腾讯 ARC Lab 的研究者们提供了一个思路: 是否可以利用对比的方式无监督的构建现实场景下图像超分辨率的可调节交互机制?这篇工作的核心是利用度量学习在高阶仿真退化中,通过对比不同样本退化强度大小的方式无监督地构建退化强度的度量空间。度量空间中的退化得分不代表真实的退化强度,但可以反映退化强度的相对大小。本篇文章提出的方法(MM-RealSR)通过度量空间中的退化得分来构建现实场景下图像超分辨率的可调节交互机制。文章已被 ECCV 2022 会议接收。

本文提出方案与现有方法的对比。推荐:可调节的真实场景图像超分辨率, 腾讯 ARC Lab 利用度量学习来解决。论文 6:HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

摘要:视觉 Transformer 的最新进展表明,在基于点积自注意力的新空间建模机制驱动的各种任务中取得了巨大成功。在本文中,来自清华大学和 Meta AI 的研究者证明了视觉 Transformer 背后的关键成分,即输入自适应、长程和高阶空间交互,也可以通过基于卷积的框架有效实现。作者提出了递归门卷积(),它用门卷积和递归设计进行高阶空间交互。新操作具有高度灵活性和可定制性,与卷积的各种变体兼容,并将自注意力中的二阶交互扩展到任意阶,而不引入显著的额外计算。

HorNet 基本构建块概览。


推荐:清华 & Meta 提出 HorNet,用递归门控卷积进行高阶空间相互作用。论文 7:How to Robustify Black-Box ML Models? A Zeroth-Order Optimization Perspective


摘要:这里介绍一篇密歇根州立大学 (Michigan State University) 和 MIT-IBM AI 实验室的一篇关于黑箱防御工作的文章,本文被 ICLR 2022 接收为 spotlight paper, 代码和模型均已开源。


ZO-AE-DS 的模型架构。推荐:MSU 联合 MIT-IBM 提出首个黑箱防御框架。

相关文章
|
机器学习/深度学习 自然语言处理 算法
7 Papers & Radios | 新型Transformer架构解决多智能体强化学习问题;ICRA 2022最佳论文出炉(2)
7 Papers & Radios | 新型Transformer架构解决多智能体强化学习问题;ICRA 2022最佳论文出炉
123 0
7 Papers & Radios | 新型Transformer架构解决多智能体强化学习问题;ICRA 2022最佳论文出炉(2)
|
机器学习/深度学习 编解码 人工智能
7 Papers & Radios | Bengio等用GFlowNets统一生成模型;首个黑箱防御框架
7 Papers & Radios | Bengio等用GFlowNets统一生成模型;首个黑箱防御框架
|
人工智能 编解码 自然语言处理
7 Papers & Radios | 爆火论文打造《西部世界》雏形;OpenAI终结扩散模型
7 Papers & Radios | 爆火论文打造《西部世界》雏形;OpenAI终结扩散模型
120 0
|
人工智能 运维 自然语言处理
7 Papers & Radios | 华为配置管理研究获SIGCOMM 2022最佳论文;用即插即用模块改进ViT和卷积模型
7 Papers & Radios | 华为配置管理研究获SIGCOMM 2022最佳论文;用即插即用模块改进ViT和卷积模型
|
机器学习/深度学习 传感器 人工智能
7 Papers | 英伟达64个A100训练StyleGAN-T;9类生成式AI模型综述
7 Papers | 英伟达64个A100训练StyleGAN-T;9类生成式AI模型综述
240 0
|
机器学习/深度学习 编解码 人工智能
7 Papers & Radios | 新型Transformer架构解决多智能体强化学习问题;ICRA 2022最佳论文出炉(1)
7 Papers & Radios | 新型Transformer架构解决多智能体强化学习问题;ICRA 2022最佳论文出炉
279 0
|
人工智能 编解码 自然语言处理
7 Papers & Radios | 谷歌下一代AI架构Pathways论文放出;何恺明组只用ViT做主干进行目标检测(2)
7 Papers & Radios | 谷歌下一代AI架构Pathways论文放出;何恺明组只用ViT做主干进行目标检测
162 0
|
机器学习/深度学习 人工智能 编解码
7 Papers & Radios | 谷歌下一代AI架构Pathways论文放出;何恺明组只用ViT做主干进行目标检测(1)
7 Papers & Radios | 谷歌下一代AI架构Pathways论文放出;何恺明组只用ViT做主干进行目标检测
225 0
|
机器学习/深度学习 自然语言处理 算法
7 Papers & Radios | CVPR 2022最佳/最佳学生论文;大型语言模型教会智能体进化(2)
7 Papers & Radios | CVPR 2022最佳/最佳学生论文;大型语言模型教会智能体进化
142 0
|
传感器 机器学习/深度学习 自然语言处理
7 Papers & Radios | CVPR 2022最佳/最佳学生论文;大型语言模型教会智能体进化(1)
7 Papers & Radios | CVPR 2022最佳/最佳学生论文;大型语言模型教会智能体进化