StackGAN 论文阅读笔记(三)

简介: StackGAN 论文阅读笔记(三)

评价方式


客观评价

• 使用Inception Score

• 在COCO数据集上,直接使用预训练的

Inception模型

• 对于CUB和Oxford-102,使用finetune后的Inception模型

主观评价

• 从COCO的验证集中随机选择4k个文本描述

• 从CUB和Oxford-102的测试集中每个类别随机选择50个文本描述

• 对于每个描述,使用模型生成5个图像

• 在相同的文本描述下,10个评测者对不同模型输出的结果进行排名


模型对比


模型比较

• 对于CUB、Oxford-102和COCO三个数据集,StackGAN在客观和主观评价上都取得了最佳结果

• GAN-INT-CLS只能生成64*64分辨率的图像,缺乏图像细节,得分较低

• GAWWN虽然可以取得更高的得分,但需要使用额外的输入信息,否则无法取得任何有意义的输出,并且得分仍然低于StackGAN




• 阶段1的GAN能够绘制对象的粗略形状和颜色,但一般模糊不清,缺少细节并带有各种缺陷,特别是对于前景目标

• 阶段2的GAN会在阶段1的基础上进一步补充细节,并且在阶段1没能绘制出合理的形状时,仍然能生成合理的对象

• 使用阶段2的判别器来提取生成图像和真实图像的特征,以寻找离生成图像最接近的真实图像,结果表明,生成的结果并不是简单的复制真实图像



论文总结


• 提出了堆叠的GAN网络,结合条件增强方法,能够生成照片级的图像

• 其中阶段1的GAN网络根据给定的文本描述,来生成颜色和形状基本满足要求的草图

• 阶段2的GAN网络,能够纠正阶段1结果的缺陷,并增加更多细节

• 一系列实验显示,与现有的文本到图像方法相比,StackGAN能生成具有更高分辨率更多细节和多样性的目标图像


论文总结


• 提出了堆叠的GAN网络,结合条件增强方法,能够生成照片级的图像

• 其中阶段1的GAN网络根据给定的文本描述,来生成颜色和形状基本满足要求的草图

• 阶段2的GAN网络,能够纠正阶段1结果的缺陷,并增加更多细节

• 一系列实验显示,与现有的文本到图像方法相比,StackGAN能生成具有更高分辨率更多细节和多样性的目标图像


目录
相关文章
|
3月前
|
算法 数据挖掘 数据建模
【2023年4月美赛加赛】Y题:Understanding Used Sailboat Prices 三篇完整论文及代码
本文概述了2023年4月美赛加赛Y题“Understanding Used Sailboat Prices”的三篇完整论文及代码,涉及二手帆船定价的数学模型构建、区域效应分析、模型在香港市场的适用性验证,以及对帆船市场因素的深入分析和预测。
44 0
|
6月前
|
机器学习/深度学习 人工智能 计算机视觉
2023年12月 论文推荐
12月已经过了一半了,还有2周就是2024年了,我们来推荐下这两周我发现的一些好的论文,另外再推荐2篇很好的英文文章。
171 1
|
机器学习/深度学习 自然语言处理 算法
WikiRank论文解读
WikiRank是2018年提出来的,作者认为背景知识可以提供文档的有价值信息,但是它们很少呗应用到关键词抽取任务中来。
94 0
|
6月前
|
机器学习/深度学习 算法 固态存储
【论文泛读】 Deep Learning 论文合集
【论文泛读】 Deep Learning 论文合集
|
6月前
|
人工智能 Unix 开发工具
vimtutor阅读笔记
csdn博客搬运 vim 常用操作
54 0
|
机器学习/深度学习 自然语言处理 机器人
Transformer - 李宏毅笔记
Transformer - 李宏毅笔记
264 0
|
机器学习/深度学习 编解码 自然语言处理
StackGAN 论文阅读笔记(二)
StackGAN 论文阅读笔记(二)
82 0
StackGAN 论文阅读笔记(二)
|
机器学习/深度学习 编解码 自然语言处理
StackGAN 论文阅读笔记(一)
StackGAN 论文阅读笔记(一)
96 0
StackGAN 论文阅读笔记(一)
|
机器学习/深度学习 编解码 算法
DGP 论文阅读笔记
DGP 论文阅读笔记
242 0
DGP 论文阅读笔记
|
机器学习/深度学习 编解码 监控
BigGAN-论文阅读笔记
BigGAN-论文阅读笔记
227 0
BigGAN-论文阅读笔记