优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法

简介: 近些年来,生成对抗网络在许多图像生成和图像编辑任务上都获得了很大的成功,并受到越来越多的关注。对于图像编辑任务,现在面临的两个重要的挑战分别是:如何指导网络向目标图像学习(以提升图像编辑的效果)和如何感知输入图像内容(以提升图像编辑的精度)。

近些年来,生成对抗网络在许多图像生成和图像编辑任务上都获得了很大的成功,并受到越来越多的关注。对于图像编辑任务,现在面临的两个重要的挑战分别是:如何指导网络向目标图像学习(以提升图像编辑的效果)和如何感知输入图像内容(以提升图像编辑的精度)。

悉尼科技大学 FEIT 三年级博士生,优必选悉尼AI研究院访问学生,陶大程教授学生王超岳在雷锋网 AI研习社主办的学术青年分享会上结合他的两篇论文Tag Disentangled Generative Adversarial Networks for Object Image Re-rendering(IJCAI 2017 Best student paper)和Perceptual Adversarial Networks for Image-to-Image Transformation(arXiv 2017),分享了对图像编辑做出的相应探索。

分享内容如下:

常见的图像编辑有图像去雨(雪)、图像填充、素描到照片、风格转换、图像超分辨率、图像上色、图像旋转、时间变换等,抽象来说就是给定一张图像以及要求,来生成新的图像。即让机器理解图像和生成图像。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

生成对抗网络是由Goodfellow在2014年提出的,算是一种新的网络架构,可以做有监督或无监督的学习。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

基于GANs的图像编辑框架如下所示:

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

接下来介绍第一篇论文,用于图像转换任务的感知对抗网络(Perceptual Adversarial Network,PAN)。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

近两年基于GANs的框架,有很多不同的优化,下图是对Pixel-wise loss、GANs loss和Perceptual loss的对比工作。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

Pixel loss优点是使用简单、训练速度快、稳定,缺点是输出图像模糊,质量低。

GAN loss优点是能提升生成图像质量,更加真实,锐利,缺点是学习整体生成分布,无法单独使用。

Perceptual loss优点是注重图像包含的高维特征,感知效果,缺点是受限于预训练的其他网络。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是对提升生成图像质量做出的一些研究,引入不同的loss来生成不同的输出图像。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

他们希望有新的loss函数来弥补现有的问题,持续缩小生成图像和真实图像的差距。基于这样的想法提出了感知对抗损失。优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

使用感知对抗损失的理由如下:

感知:衡量生成图像和真实图像的高维特征的差异,并致力于缩小他们。

对抗:当现有高维特征的差异小于一定数值m ,D网络被更新以寻找新的高维空间,以进一步缩小仍存在的不同。

统一:所有训练统一在一个GAN框架中,无需引入其他预训练网络,且不受任务限制。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

他们引入感知对抗loss加GAN loss的结构,在这里引入GAN loss来让生成图像的整体分布符合真实图像的整体分布。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是针对于这个网络的相关实验,主要有图像的去雨、从分割后的label的图像到街景的重现、卫星图到谷歌地图的转换、图像补全、素描生成真实图像的任务。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是对比图像去雨雪的任务,他们的模型在色差的控制等方面都有所提升。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是图像补全任务,对比CVPR 2016的Context Encoder,PAN能得到更加优化的效果。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

进行Pixel2pixel实验时与pix2pix做了对比,也可以看到明显提升。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

解决图像生成的质量之后,还有一个问题:interpretable。也就是如何解开神经网络的黑箱,并帮助计算机进一步理解图像。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

针对于如何在图像转换过程中理解整个网络,并控制中间层信息的表征,他们提出标签分解生成对抗网络(Tag Disentangled Generative Adversarial Networks, TDGAN),用于进行目标图像的再次渲染(Re-rendering)。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

给定输入图像,里面会包含一系列的输入信息,人脑看到之后很容易分理出这些信息,但之前的网络很难理解这些信息,因此很难对输入图像进行精细编辑,现在他们想要让网络能更进一步理解这些信息。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

他们提出分解表征法。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结


解决方案:标签。只要简单的改变标签,就能很容易生成微笑的图像。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

基于此,他们提出TDGAN,包括下图四个子网络。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

网络的框架图如下:

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

主要有f1、f2、f3、f4四个约束项:

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

这四个子网络采用如下交替训练的形式:

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是工作相应的实验结果,给定单张椅子,给定一些想要的角度,可以生成不同角度的效果,另外可以生成人在不同光线及表情下的效果。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下图是他们在两个数据集下做的一些任务。可以通过给定单张椅子照片,生成不同角度的椅子;也可以控制输入人脸图像的多种性质,如改变其角度,光照,表情等。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

总结如下:现有的很多方法都是在GANs的框架下,希望提升现有的图像编辑效果和提升图像编辑的精度,他们做了以下尝试,去让任务表现更好。

第一是从学习的层面,不再只是从像素层面或固定高维空间上去缩小真实图像和转换图像之间的不同,而是利用对抗学习的思想去持续寻找并缩小真实图像和转换图像之间尚存的差异。另一方面,他们希望算法可以更深入的理解图像,并帮助计算机能更加智能,通过提取和分解图像中包含的各种信息,让算法可以更精确的编辑图像,从而得到想要的结果。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

Perceptual Adversarial Networks for Image-to-Image Transformation

论文地址:https://arxiv.org/abs/1706.09138

Tag Disentangled Generative Adversarial Networks for Object Image Re-rendering

论文地址:https://www.ijcai.org/proceedings/2017/0404.pdf

本次分享的视频如下:




本文作者:Non
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
8天前
|
机器学习/深度学习 存储 人工智能
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
【9月更文挑战第1天】AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
|
13天前
|
人工智能 数据中心 云计算
AI网络新生态ALS发起成立,信通院、阿里云、AMD等携手制定互连新标准
9月3日,在2024 ODCC开放数据中心大会上,阿里云联合信通院、AMD等国内外十余家业界伙伴发起AI芯片互连开放生态ALS(ALink System)。
AI网络新生态ALS发起成立,信通院、阿里云、AMD等携手制定互连新标准
|
5天前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【9月更文挑战第12天】在当今科技飞速发展的时代,人工智能(AI)已深入我们的生活,从智能助手到自动驾驶,从医疗诊断到金融分析,其力量无处不在。这一切的核心是神经网络。本文将带领您搭乘Python的航船,深入AI的大脑,揭秘智能背后的秘密神经元。通过构建神经网络模型,我们可以模拟并学习复杂的数据模式。以下是一个使用Python和TensorFlow搭建的基本神经网络示例,用于解决简单的分类问题。
26 10
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI的奥秘:深度学习与神经网络
【9月更文挑战第11天】本文将深入探讨人工智能的核心领域——深度学习,以及其背后的神经网络技术。我们将从基础理论出发,逐步深入到实践应用,揭示这一领域的神秘面纱。无论你是AI领域的初学者,还是有一定基础的开发者,都能在这篇文章中获得新的启示和理解。让我们一起踏上这场探索之旅,揭开AI的神秘面纱,体验深度学习的魅力。
|
6天前
|
机器学习/深度学习 人工智能 TensorFlow
深入骨髓的解析:Python中神经网络如何学会‘思考’,解锁AI新纪元
【9月更文挑战第11天】随着科技的发展,人工智能(AI)成为推动社会进步的关键力量,而神经网络作为AI的核心,正以其强大的学习和模式识别能力开启AI新纪元。本文将探讨Python中神经网络的工作原理,并通过示例代码展示其“思考”过程。神经网络模仿生物神经系统,通过加权连接传递信息并优化输出。Python凭借其丰富的科学计算库如TensorFlow和PyTorch,成为神经网络研究的首选语言。
11 1
|
7天前
|
机器学习/深度学习 自然语言处理 计算机视觉
用于图像和用于自然语言的神经网络区别
主要区别总结 数据结构:图像数据是二维像素矩阵,具有空间结构;文本数据是一维序列,具有时间结构。 网络架构:图像处理常用CNN,注重局部特征提取;自然语言处理常用RNN/LSTM/Transformer,注重序列和全局依赖。 操作单元:图像处理中的卷积核在空间上操作;自然语言处理中的注意力机制在序列上操作。
9 2
|
19天前
|
存储 缓存 网络协议
网络丢包排查方法
网络丢包排查方法
|
21天前
|
监控 安全 iOS开发
|
21天前
|
数据采集 机器学习/深度学习 人工智能
Python爬虫入门指南探索AI的无限可能:深度学习与神经网络的魅力
【8月更文挑战第27天】本文将带你走进Python爬虫的世界,从基础的爬虫概念到实战操作,你将学会如何利用Python进行网页数据的抓取。我们将一起探索requests库和BeautifulSoup库的使用,以及反爬策略的应对方法。无论你是编程新手还是有一定经验的开发者,这篇文章都将为你打开一扇通往数据抓取世界的大门。
|
28天前
|
域名解析 运维 监控
网络故障排查的常用工具与方法:技术深度解析
【8月更文挑战第20天】网络故障排查是一项复杂而重要的工作,需要网络管理员具备扎实的网络知识、丰富的实践经验和灵活的问题解决能力。通过掌握常用工具和方法,遵循科学的排查流程,可以显著提高故障排查的效率和准确性。希望本文能为读者在网络故障排查方面提供有益的参考和启示。