【Ian Goodfellow盛赞】一个GAN生成ImageNet全部1000类物体

简介: Ian Goodfellow刚刚在Twitter盛赞一篇论文,担心仅仅浏览摘要无法充分体会其突破。这篇正在ICLR-18双盲审核中的论文,提出了一种叫做“谱归一化”的新的权重归一化方法,稳定对抗生成网络判别器的训练,而且所提出的GAN变体SN-GAN是第一个成功用于ImageNet全部1000个类别的GAN变体。

就在几小时前,生成对抗网络(GAN)的发明人Ian Goodfellow在Twitter上发文,激动地推荐了一篇论文:

c351a636552bfce547bb7931c5fdde076c746a47

Goodfellow表示,虽然GAN十分擅长于生成逼真的图像,但仅仅限于单一类型,比如一种专门生成人脸的GAN,或者一种专门生成建筑物的GAN,要用一个GAN生成ImageNet全部1000种类的图像是不可能的。但是,这篇ICLR论文做到了。

是什么论文这么厉害?

点开链接,可以看到Ian Goodfellow更加热情的赞美:

4324e79eb3e9b4aa9c7a62dfcee26d695a4deabc

这是一篇很棒的论文!

这是一篇很棒的论文!我认为这篇论文没有充分说明它结论的重要性,我担心仅仅浏览摘要会让人错过这项突破。

“我们在CIFAR10,STL-10和ILSVRC2012数据集上测试了谱归一化的功效,通过实验证实了相对于那些使用此前提出的训练稳定技术训练的GAN,谱归一化GAN(SN-GAN)能够生成质量相同乃至更好的图像。”这个描述太低调了,这篇论文展现了在ILSVRC2012数据集上的一个超大的飞跃。

在这篇论文之前,仅有一种GAN在ILSVR2012数据集上表现很好,那就是AC-GAN。但AC-GAN实际上有点作弊,因为它把ImageNet分成了100个更小的数据集,每个数据集仅含10个种类的数据。新的SN-GAN是第一个用一种GAN就覆盖ImageNet全部1000种类数据的GAN变体。

将GAN扩展到更大的种类上面去一直以来都没有得到很好解决,现在这篇论文为我们带来了10倍的飞跃。

生成对抗网络的谱归一化,稳定判别器训练

看上去真的很厉害的样子。虽然Goodfellow说仅仅浏览摘要无法充分体会这篇论文的好,但是我们还是从摘要开始看起:

题目:生成对抗网络的谱归一化

摘要:生成对抗网络的研究面临的挑战之一是其训练的不稳定性。在本文中,我们提出了一种叫做“谱归一化”(spectral normalization)的新的权重归一化(weight normalization)技术,来稳定判别器的训练。这种新归一化技术计算轻巧,易于并入现有的部署当中。我们在CIFAR10,STL-10和ILSVRC2012数据集上测试了谱归一化的功效,通过实验证实了相对于那些使用此前提出的训练稳定技术训练的GAN,谱归一化GAN(SN-GAN)能够生成质量相同乃至更好的图像。

简单说,论文提出了一种新的权重归一化方法,用于稳定判别器的训练。作者在论文中写道,他们的归一化方法需要调整的超参数只要一个,就是Lipschitz常数,而且即使不调整这个超参数,也能获得满意的性能。此外,算法实现简单,额外的计算成本很小。

作者在论文中将这种新的“谱归一化”方法与其他归一化技术,比如权重归一化(Salimans&Kingma,2016)、权重削减clipping(Arjovsky等,2017)和梯度惩罚gradient penalty(Gulrajani等,2017)做了比较,并通过实验表明,在没有批量归一化、权重衰减和判别器特征匹配的情况下,谱归一化改善生成的图像质量,效果比权重归一化和梯度惩罚更好。

52115aba3054185f94d245c336a8e203ff9818cd

第一个成功应用于ImageNet全部1000个类别的GAN变体

最后,来看让Ian Goodfellow觉得没有充分强调的部分。

在论文的4.2这节,作者简单描述了他们的方法在ImageNet训练的情况,如作者所写,“我们将我们的方法应用于ILRSVRC2012数据集,训练类别conditional GANs……我们的SN-GAN是所有方法中唯一训练成功了的,据我们所知,这也是首次用单对判别器和生成器从ImageNet数据集生成不错图像的尝试”。

af5f7bfa0a765513003c70309f92bb8d7804fc3c

  • 论文地址:https://openreview.net/pdf?id=B1QRgziT-
  • OpenReview:https://openreview.net/forum?id=B1QRgziT-

原文发布时间为:2017-11-21
本文作者:费欣欣
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号
相关文章
|
7月前
|
机器学习/深度学习 编解码 计算机视觉
【论文速递】CVPR2022-Blind2Unblind:具有可见盲点的自监督图像去噪
【论文速递】CVPR2022-Blind2Unblind:具有可见盲点的自监督图像去噪
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习还不如浅层网络?RL教父Sutton持续反向传播算法登Nature
【9月更文挑战第24天】近年来,深度学习在人工智能领域取得巨大成功,但在连续学习任务中面临“损失可塑性”问题,尤其在深度强化学习中更为突出。加拿大阿尔伯塔大学的研究人员提出了一种名为“持续反向传播”的算法,通过选择性地重新初始化网络中的低效用单元,保持模型的可塑性。该算法通过评估每个连接和权重的贡献效用来决定是否重新初始化隐藏单元,并引入成熟度阈值保护新单元。实验表明,该算法能显著提升连续学习任务的表现,尤其在深度强化学习领域效果明显。然而,算法也存在计算复杂性和成熟度阈值设置等问题。
63 2
|
4月前
|
机器学习/深度学习 自然语言处理
准确率达60.8%,浙大基于Transformer的化学逆合成预测模型,登Nature子刊
【8月更文挑战第29天】浙江大学团队在《Nature》子刊上发表的论文介绍了一款名为EditRetro的基于Transformer架构的化学逆合成预测模型,其准确率高达60.8%,为化学合成领域带来了革命性的变化。此模型无需依赖传统化学反应模板,具备更强的泛化能力和多样化合成路线生成能力,在药物研发和材料科学领域展现出巨大潜力,尽管仍存在一定的错误率和计算资源需求高等挑战。论文详情见:https://www.nature.com/articles/s41467-024-50617-1。
58 3
|
7月前
|
机器学习/深度学习 Shell 计算机视觉
【论文精读】CVPR2021 - ReDet:一种用于航空目标检测的旋转等变检测器
【论文精读】CVPR2021 - ReDet:一种用于航空目标检测的旋转等变检测器
|
7月前
|
机器学习/深度学习 数据可视化 计算机视觉
【论文速递】CVPR2022 - 检测测器的局部和全局知识蒸馏
【论文速递】CVPR2022 - 检测测器的局部和全局知识蒸馏
|
7月前
|
机器学习/深度学习 数据挖掘 网络安全
【论文速递】CVPR2022 - 用于半监督物体检测的尺度等效蒸馏
【论文速递】CVPR2022 - 用于半监督物体检测的尺度等效蒸馏
|
7月前
|
存储 算法 计算机视觉
【论文速递】CVPR2022 - MeMOT: 带有记忆的多目标跟踪
【论文速递】CVPR2022 - MeMOT: 带有记忆的多目标跟踪
Vision Transformer的鸟类图像分类 数据代码分享
Vision Transformer的鸟类图像分类 数据代码分享
114 0
|
机器学习/深度学习 算法 计算机视觉
【检测|RCNN系列-1】目标检测算法开山之作RCNN(附论文获取方式)
【检测|RCNN系列-1】目标检测算法开山之作RCNN(附论文获取方式)
193 0
|
机器学习/深度学习 存储 人工智能
7 Papers & Radios | Hinton前向-前向神经网络训练算法;科学家造出「虫洞」登Nature封面
7 Papers & Radios | Hinton前向-前向神经网络训练算法;科学家造出「虫洞」登Nature封面
128 0
下一篇
无影云桌面