实验结果
CELEBA-HQ
•
CELEBA数据集有202599张图像,分辨率从 43x55 到 6732x8984,不同图像质量差别很大
•
使用一个预训练的卷积自编码器来进行去除JPEG噪声
•
使用一个预训练的4倍超分辨率GAN来提升图像分辨率
•
基于CelebA中已有的脸部关键点标注,来进行人脸的截取和旋转矫正
•
处理了所有的CelebA图像,然后使用基于频谱的质量评价方式,选出最好的30000张生成图像
• 使用8个Tesla V100 GPU 并行训练了4天,此时SWD结果不再变化
• 根据当前的训练分辨率,使用自适应的batch size,来最大效率的使用显存
• 为了证明作者的改进与loss很大程度上是相互独立的,分别尝试了LSGAN和WGAN-GP两种 loss,LSGAN更不稳定但也能得到高清的生成图像
• 除了展示生成结果外,作者还进行了latent space的插值,和渐进式训练的可视化
• 插值方式是:随机生成一系列latent code,然后对他们使用时域的高斯模糊,最后把各latent code归一化到一个超球面上
论文总结
优点
•
ProGAN相比于更早的GAN网络,生成的质量普遍都很高
•
ProGAN在生成高分辨率的图像时也能够进行稳定的训练
•
目前的生成效果已经快令人信服了,特别是在CELEBA-HQ
数据集上
不足
•
离真正照片级的生成仍有很长一段距离
•
目前的生成还做不到对图像语义和约束的理解
•
他们使用时域的高斯模糊,最后把各latent code归一化到一个超球面上
[外链图片转存中…(img-87HHjwYf-1664845828841)]
论文总结
优点
•
ProGAN相比于更早的GAN网络,生成的质量普遍都很高
•
ProGAN在生成高分辨率的图像时也能够进行稳定的训练
•
目前的生成效果已经快令人信服了,特别是在CELEBA-HQ
数据集上
不足
•
离真正照片级的生成仍有很长一段距离
•
目前的生成还做不到对图像语义和约束的理解
•
生成图片的细微结构也还有改进的空间