学习——Anycost Gan 风格迁移

简介: 学习——Anycost Gan 风格迁移

1. 背景


  生成对抗式网络在图像的风格迁移,换脸,图像生成等任务中取得了很好 的效果,但是因为其计算量大,存储空间大,很难应用到移动设备。


生成对抗网络(GANs) 是一种包含两个网络的深度神经网络结构,将一个网 络与另一个网络相互对立。一个被称为生成器的神经网络生成新的数据实例, 相对的,另一个被称为判别器的东西去评估他们的真实性;也就是说,判别器 决定每一个它检验的数据实例是否属于真实的训练数据集。

image.png



2. 概述


  现代渲染软件比如 Ae,Pr 常常可以使用多种分辨率进行渲染预览,本项 目便是受上述启发,提出了 Anycost GAN 用于交互式自然图像编辑,它利用了 生成对抗网络(GAN)深度学习模型的逼真的图像合成和编辑的优势,并改进了 大规模生成器所带来的计算时间成本问题。


传统 GAN 在边界设备上执行简单的 编辑需要耗费数秒的时间,会带来不好的用户交互体验。 本项目首次将 Preview 应用到了基于 GAN 的图像编辑任务, 通过训练 An ycost GAN 以支持弹性的分辨率和通道,从而以多种速度更快地生成图像。


通 过使用基于采样的多分辨率训练、自适应通道训练和生成器条件判别器,可以 在各种配置下评估 Anycost Generator,并且,与单独训练的模型相比,它能 获得更好的图像质量。

image.png

特点: 低成本生成器用于在图像编辑期间快速响应预览,全成本生成器用于渲染 高质量的最终输出。优点: 在各种成本预算(最多 10 倍计算减少)下执行 适应广泛的硬件和延迟要求 交互式图像编辑



3. 目标及方法:


  训练一个可以在各种计算环境下执行的生成器,同时输出一致质量的视觉呈现;学习一个 Anycost 生成器 多分辨率训练 通过实施多尺度训练目标来实现较低分辨率的输出,我们的生成器在每个 块 g k之后逐渐 产生更高分辨率的输出:


            x=G(w)=gK。gK−1。⋯。gk。⋯。g2og1(w)

--k:网络块的总数


  基于采样的训练目标 项目提出了一个基于采样的训练目标,其中在每次迭代中对生成器 G 和鉴 别器 D 都对单个分辨率进行采样和训练。 如图 c 所示,当 采样较低的分辨率(例如,128×128),不执行半透明部 分。 项目使用 G 的中间输出来获得较低的分辨率。


它通过一个 fromRGB 卷 积“读取”层以增加通道,然后馈送到 D 的中间层


image.png

多分辨率训练目标制定为: Cmuli−ms=Ex,k[logD(xk)]+Ew,k[log(1−D(Gk(w)))]


  自适应通道训练 为了让生成器能够以不同的成本运行,项目将训练生成器以支持可变通道。 对于自适应通道训练,允许每层使用不同的通道数乘数(统一比率,用于所有 层或每层灵活比率)。


对于每次训练迭代,使用随机采样通道乘数配置并更新相 应的权重子集(图 3c 中的黄色部分)。


为了采样过程中保留最“重要”的通道, 以尽量减少任何退化,为此,项目使用前一阶段的多分辨率生成器来初始化模 型,并根据内核的大小从最高到最低对卷积层的通道进行排序。训练中总是根 据初始排序对最重要的 αc 进行采样,其中 α ∈ [0.25, 0.5, 0.75, 1] 并 且 c 是层中的通道数。


  自适应通道训练目标写成:Cada−ch=Ex,k[log21D(xk)]+Ew,k,c[log(1−D(GCk(w)))]

C:每一层的通道配置


为保证不同子网落的输出一致,在以上基础上添加一致性损失:


Ctotal=Cada−ch+Ew,k,c[e(GCk(w),G(w))] -- :C 预先定义的距离度量


  生成器条件判别器


  项目采用基于学习的方法来实施条件反射。首先使用单热编码对 g_arch 中 的通道配置进行编码,它通过一个全连接层形成每通道调制。在传递到下一层 之前,特征图使用条件权重和偏差进行调制。对于真实图像,将随机绘制一个 g_arch 向量。


为了稳定训练,项目只将 G-conditioned 调制单元应用于判别器 的最后两个块。


image.png


4. 实验对象及结果


  对象:FFHQ (分辨率 1024)和 LSUN 汽车数据集(分辨率 512)


  分析:FID-70k on FFHQ of different multi-resolution training techniques.

image.png

与单分辨率训练相比,我们基于采样的技术可以训练一个产生具有更高图 像质量(由 FID [30] 测量)的多个分辨率输出的模型。 模型使用半通道 (Co nfig-E) 进行训练,以实现更快的消融


  FIDs on FFHQ at different resolutions and channels.

image.png

 条件鉴别器在不同的通道宽度和分辨率下提供最佳 FID。 该模型基于 Con fig-E 以实现更快的消融。

image.png


image.png

相关文章
|
3月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
深度学习中的图像风格迁移
【9月更文挑战第26天】本文将探讨如何利用深度学习技术,实现图像风格的转换。我们将从基础的理论出发,然后逐步深入到具体的实现过程,最后通过代码实例来展示这一技术的实际应用。无论你是初学者还是有经验的开发者,都能在这篇文章中找到有价值的信息。让我们一起探索深度学习的奥秘吧!
|
7月前
|
机器学习/深度学习 算法 计算机视觉
利用深度学习技术实现图像风格迁移
本文将介绍如何利用深度学习技术中的卷积神经网络,结合风格迁移算法,实现图像风格的转换。通过对图像内容和风格的理解,深度学习模型可以生成具有新风格的图像,为图像处理领域带来了新的可能性。
134 12
|
7月前
|
数据可视化 PyTorch 算法框架/工具
使用PyTorch搭建VGG模型进行图像风格迁移实战(附源码和数据集)
使用PyTorch搭建VGG模型进行图像风格迁移实战(附源码和数据集)
610 1
|
机器学习/深度学习 数据采集 编解码
深度学习原理篇 第八章:CLIP
简要介绍clip的原理和代码实现。
2206 0
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
利用深度学习实现图像风格迁移
【8月更文挑战第73天】本文通过深入浅出的方式,介绍了一种使用深度学习技术进行图像风格迁移的方法。我们将探讨如何将一张普通照片转化为具有著名画作风格的艺术作品。文章不仅解释了背后的技术原理,还提供了一个实际的代码示例,帮助读者理解如何实现这一过程。
|
5月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
使用Python实现深度学习模型:图像风格迁移与生成
【7月更文挑战第13天】 使用Python实现深度学习模型:图像风格迁移与生成
55 2
|
5月前
|
机器学习/深度学习 算法 PyTorch
深度学习中的图像风格迁移技术探析
图像风格迁移是近年来深度学习领域备受关注的研究方向之一。本文将从算法原理、实现步骤到应用案例,全面分析和探讨几种主流的图像风格迁移技术,为读者深入理解和应用这一技术提供详实的指南。 【7月更文挑战第2天】
151 1
|
6月前
|
机器学习/深度学习 算法 数据可视化
【深度学习实战】基于深度学习的图片风格快速迁移软件(Python源码+UI界面)
【深度学习实战】基于深度学习的图片风格快速迁移软件(Python源码+UI界面)
图像风格迁移
图像风格迁移
117 0
|
7月前
|
自然语言处理 Python
BERT模型基本理念、工作原理、配置讲解(图文解释)
BERT模型基本理念、工作原理、配置讲解(图文解释)
810 0