论文Express | 英伟达最新:多模态无监督图像迁移网络框架

简介:

不久前,文摘菌给大家分享了一篇Ian Goodfellow的论文,教大家如何把一张哈士奇的图像硬生生的AI成一只猫咪,论文的结果确实会让人傻傻分不清楚,点击这里查看相关内容。

然而,今天的这篇论文效果更棒!先上两张图片:

81d9277367a8dfcf25ddc3c241ec6f3f67dbf11e

当你养了一只哈士奇觉得不过瘾的时候,你可以AI出四只小猫咪,让它们一起陪你玩耍。

7ba8764df6371e5efe5ab23da5bf03b8ae925ccb

用一张猫咪的图像生成老虎、狮子或者豹子等其他猫科动物的图像!

用一张猫咪的图像生成小柯基、萨摩耶或者二哈的图像!

当然你也可以用豹子的图像生成萨摩耶、二哈或者小柯基的图像……

这种连PS大师都没见过的方法就是由康奈尔大学的Xun Huang(他同时在英伟达实习)等人提出的多维无监督图像迁移网络框架实现的。

在大数据文摘后台回复“迁移”下载论文~

以下是论文部分内容,文末有代码链接哦~

无监督图像迁移网络是计算机视觉领域的一个技术难题,即给定一张源域图像,如何在没有其他图像样本的情况下,学习相应目标域图像的条件分布。当处理多维条件分布时,现有的方法是在过度简化的假设条件下,通过绘制源域图像和确定的、一对一的目标图像来进行建模。

然而,上述方法无法用来生成给定源域图像的多种多样的目标图像。因此,本文提出了一种多维无监督图像迁移网络框架。

本文中假定代表图像可以被分解成域不变的内容代码,并能捕获特定于域的属性。为了能将图像迁移到另一个域中,本文通过对任意目标域图片的风格空间进行采样,并利用获得的风格代码生成内容代码。

论文方法

c605d7483fde0f12880406e34d718a20db64eed7

▲论文方法

上图说明了论文提出方法,首先将每个域Xi中的图像进行编码后放入一个共享的内容空间C和特定于域的风格空间Si,每个编码器还有逆向解码功能。

其次,为了把域X1中的图像(例如一只美洲豹)迁移到域X2中(例如各种家猫),我们在目标风格空间(家猫风格)使用随机的风格代码重组了输入图像的内容代码,不同的风格代码生成不同的输出结果。

相关算法

为了实现上述随机风格迁移,本文参考了下列相关算法:

d47e62d2b349aca45e42305ed6714efbe5ed61d9 生成对抗网络(GANs)

本文中,通过参考目标域的真实图像,使用GANs调整了迁移图像的分布细节。

d47e62d2b349aca45e42305ed6714efbe5ed61d9 图像迁移

在计算出每个域中图像的风格和每个风格对应的样本个数后,我们将每种风格作为一个单独的域进行处理。并使用多域图像迁移学习绘制每个风格对图像,进而实现多维迁移。

d47e62d2b349aca45e42305ed6714efbe5ed61d9风格迁移


本文借助图像的内容特征和风格特征,提出的模型解决了单一样本的目标风格迁移和由图像集才能生成目标风格的弊端。

d47e62d2b349aca45e42305ed6714efbe5ed61d9非耦合表示学习

本文受到了最近兴起的非耦合表示学习(disentangled representation learning)框架的启发。虽然很难定义图像的内容和风格,而且不同的图像要使用不同的定义,因此,我们将内容定义为下属空间,将风格定义为底层空间。

论文模型

e2c98d170d5f72f031e06af64ca3d568b32af2ef

▲论文模型

本文图像迁移由两个自动编码器组成(上图中分别用红色和蓝色箭头标注),每个域中都有这两个自动编码器。每个自动编码器的隐式代码分别由内容代码c和风格代码s组成。

用对抗对象(上图中的虚线)对模型进行训练以保证生成的迁移图像和目标域的真实图像别无二致。同时也用双向重构对象(上图中的点滑线)对模型进行了训练,以保证图像和隐式代码之间的双向重构。

5628e4f1c730ffb194d00df703aa8cb07cdf8769

▲自动编码器的结构

上图为本文中自动编码器的结构。它由内容编码器、风格编码器和联合编码器组成。

评价指标

论文中使用了下列指标来评估模型性能:

d47e62d2b349aca45e42305ed6714efbe5ed61d9 个人偏好
d47e62d2b349aca45e42305ed6714efbe5ed61d9 LPIPS距离

d47e62d2b349aca45e42305ed6714efbe5ed61d9条件初始得分(Conditional Inception Score,CIS)

实验结果

此外,该方法还能根据图像中物体的轮廓生成迁移图像。

1fc1c14dc28702b86e4c7a93e44b726099301f66

▲轮廓迁移(拯救淘宝卖家的神器!)

上图中,输入图像为一只女士皮鞋的轮廓,GT是皮鞋的真实图像3,该模型可以根据图像中物体的轮廓进行图像迁移。

在第三行,当输入一张皮鞋的真实图像,该模型可以生成皮鞋的轮廓,即实现逆向迁移。



原文发布时间为:2018-04-17

本文作者:文摘菌

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

▲动物图像迁移


视频中,该模型成功的实现了一类动物向另一类动物的图像迁移。当输入一张给定图像时,可以生成多种迁移图像。生成的迁移图像中动物的形状发生了明显的改变,但是它们的表情保持一致。


该模型还可以实现高分辨率的风景图像迁移。


640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

▲风景图像迁移

相关文章
|
2月前
|
机器学习/深度学习 编解码 计算机视觉
【APFN】从大佬论文中探索如何分析改进金字塔网络
【APFN】从大佬论文中探索如何分析改进金字塔网络
44 0
|
2月前
|
计算机视觉
【论文复现】经典再现:yolov4的主干网络重构(结合Slim-neck by GSConv)
【论文复现】经典再现:yolov4的主干网络重构(结合Slim-neck by GSConv)
51 0
【论文复现】经典再现:yolov4的主干网络重构(结合Slim-neck by GSConv)
|
3月前
|
数据采集 存储 数据处理
Scrapy:Python网络爬虫框架的利器
在当今信息时代,网络数据已成为企业和个人获取信息的重要途径。而Python网络爬虫框架Scrapy则成为了网络爬虫工程师的必备工具。本文将介绍Scrapy的概念与实践,以及其在数据采集和处理过程中的应用。
23 1
|
3月前
|
前端开发 JavaScript Java
毕业设计论文|基于SSM的网络教学系统设计与实现
毕业设计论文|基于SSM的网络教学系统设计与实现
|
2月前
|
机器学习/深度学习 算法 PyTorch
python手把手搭建图像多分类神经网络-代码教程(手动搭建残差网络、mobileNET)
python手把手搭建图像多分类神经网络-代码教程(手动搭建残差网络、mobileNET)
46 0
|
3月前
|
NoSQL Linux Redis
Redis 的网络框架是实现了 Reactor 模型吗?
Redis 的网络框架是实现了 Reactor 模型吗?
|
13天前
|
网络协议 Java API
Python网络编程基础(Socket编程)Twisted框架简介
【4月更文挑战第12天】在网络编程的实践中,除了使用基本的Socket API之外,还有许多高级的网络编程库可以帮助我们更高效地构建复杂和健壮的网络应用。这些库通常提供了异步IO、事件驱动、协议实现等高级功能,使得开发者能够专注于业务逻辑的实现,而不用过多关注底层的网络细节。
|
存储 设计模式 网络协议
Netty网络框架(一)
Netty网络框架
31 1
|
1月前
|
机器学习/深度学习 开发者
论文介绍:基于扩散神经网络生成的时空少样本学习
【2月更文挑战第28天】论文介绍:基于扩散神经网络生成的时空少样本学习
14 1
论文介绍:基于扩散神经网络生成的时空少样本学习
|
1月前
|
机器学习/深度学习 编解码 异构计算
ELAN:用于图像超分辨率的高效远程注意力网络
ELAN:用于图像超分辨率的高效远程注意力网络
33 1