《Progressive Growing of GANs for Improved Quality, Stability, and Variation》-论文阅读笔记(三)

简介: 《Progressive Growing of GANs for Improved Quality, Stability, and Variation》-论文阅读笔记(三)

实验结果


CELEBA-HQ

CELEBA数据集有202599张图像,分辨率从 43x55 到 6732x8984,不同图像质量差别很大

使用一个预训练的卷积自编码器来进行去除JPEG噪声

使用一个预训练的4倍超分辨率GAN来提升图像分辨率

基于CelebA中已有的脸部关键点标注,来进行人脸的截取和旋转矫正

处理了所有的CelebA图像,然后使用基于频谱的质量评价方式,选出最好的30000张生成图像



• 使用8个Tesla V100 GPU 并行训练了4天,此时SWD结果不再变化

• 根据当前的训练分辨率,使用自适应的batch size,来最大效率的使用显存

• 为了证明作者的改进与loss很大程度上是相互独立的,分别尝试了LSGAN和WGAN-GP两种 loss,LSGAN更不稳定但也能得到高清的生成图像

• 除了展示生成结果外,作者还进行了latent space的插值,和渐进式训练的可视化

• 插值方式是:随机生成一系列latent code,然后对他们使用时域的高斯模糊,最后把各latent code归一化到一个超球面上



论文总结


优点

ProGAN相比于更早的GAN网络,生成的质量普遍都很高

ProGAN在生成高分辨率的图像时也能够进行稳定的训练

目前的生成效果已经快令人信服了,特别是在CELEBA-HQ

数据集上

不足

离真正照片级的生成仍有很长一段距离

目前的生成还做不到对图像语义和约束的理解

他们使用时域的高斯模糊,最后把各latent code归一化到一个超球面上


[外链图片转存中…(img-87HHjwYf-1664845828841)]


论文总结


优点

ProGAN相比于更早的GAN网络,生成的质量普遍都很高

ProGAN在生成高分辨率的图像时也能够进行稳定的训练

目前的生成效果已经快令人信服了,特别是在CELEBA-HQ

数据集上

不足

离真正照片级的生成仍有很长一段距离

目前的生成还做不到对图像语义和约束的理解

生成图片的细微结构也还有改进的空间

目录
相关文章
|
4月前
|
机器学习/深度学习 算法
【文献学习】RoemNet: Robust Meta Learning based Channel Estimation in OFDM Systems
本文提出了一种基于元学习的鲁棒信道估计算法RoemNet,旨在解决OFDM系统中由于训练和部署信道模型不一致导致的问题,并展示了其在不同信道环境下优越的性能。
43 5
|
2月前
|
机器学习/深度学习 编解码 算法
论文精度笔记(二):《Deep Learning based Face Liveness Detection in Videos 》
论文提出了基于深度学习的面部欺骗检测技术,使用LRF-ELM和CNN两种模型,在NUAA和CASIA数据库上进行实验,发现LRF-ELM在检测活体面部方面更为准确。
36 1
论文精度笔记(二):《Deep Learning based Face Liveness Detection in Videos 》
|
4月前
|
机器学习/深度学习
【文献学习】Exploring Deep Complex Networks for Complex Spectrogram Enhancement
介绍了一种用于语音增强的复数深度神经网络(CDNN),它通过复数值的短时傅立叶变换(STFT)映射到干净的STFT,并提出了参数整流线性单位(PReLU)的复数扩展,实验结果表明CDNN在语音增强方面相对于实值深层神经网络(DNN)具有更好的性能。
54 2
【文献学习】Exploring Deep Complex Networks for Complex Spectrogram Enhancement
|
4月前
|
机器学习/深度学习 编解码 人工智能
【文献学习】Deep Learning for Joint Channel Estimation and Signal Detection in OFDM Systems
该文章提出了一种基于深度学习的方法,用于OFDM系统中的联合信道估计和信号检测,通过信道估计网络(CENet)和信号检测网络(CCRNet)改善了传统方法的性能。
84 2
|
7月前
|
算法 计算机视觉
2017cvpr论文解读——Nasal Patches and Curves for Expression-Robust 3D Face Recognition
2017cvpr论文解读——Nasal Patches and Curves for Expression-Robust 3D Face Recognition
50 1
|
编解码 计算机视觉
NeRF系列(3): Semantic-aware Occlusion Filtering Neural Radiance Fields in the Wild 论文解读
NeRF系列(3): Semantic-aware Occlusion Filtering Neural Radiance Fields in the Wild 论文解读
238 2
|
机器学习/深度学习 编解码
《Progressive Growing of GANs for Improved Quality, Stability, and Variation》-论文阅读笔记(二)
《Progressive Growing of GANs for Improved Quality, Stability, and Variation》-论文阅读笔记(二)
127 0
《Progressive Growing of GANs for Improved Quality, Stability, and Variation》-论文阅读笔记(二)
|
机器学习/深度学习
《Progressive Growing of GANs for Improved Quality, Stability, and Variation》-论文阅读笔记(一)
《Progressive Growing of GANs for Improved Quality, Stability, and Variation》-论文阅读笔记(一)
113 0
《Progressive Growing of GANs for Improved Quality, Stability, and Variation》-论文阅读笔记(一)
|
机器学习/深度学习 搜索推荐 算法
【推荐系统论文精读系列】(三)--Matrix Factorization Techniques For Recommender Systems
现在推荐系统一般是基于两种策略,一种是基于文本过滤的方式,另外一种是协同过滤,而基于文本过滤的方法是创造画像为用户或者物品,说白了就是用一些描述性的特征去描述它们,例如对于一部电影来说,可以为其创造画像电影类型、导演、演员、电影市场、票房等来进行描述,对于用户来说,可以用一些人口统计特征来进行描述。
504 1
|
机器学习/深度学习 人工智能 搜索推荐
【推荐系统论文精读系列】(十二)--Neural Factorization Machines for Sparse Predictive Analytics
现在很多基于网站应用的预测任务都需要对类别进行建模,例如用户的ID、性别和职业等。为了使用通常的机器学习预测算法,需要将这些类别变量通过one-hot将其转化成二值特征,这就会导致合成的特征向量是高度稀疏的。为了有效学习这些稀疏数据,关键就是要解释不同特征之间的影响。
399 0