StackGAN 论文阅读笔记(三)

简介: StackGAN 论文阅读笔记(三)

评价方式


客观评价

• 使用Inception Score

• 在COCO数据集上,直接使用预训练的

Inception模型

• 对于CUB和Oxford-102,使用finetune后的Inception模型

主观评价

• 从COCO的验证集中随机选择4k个文本描述

• 从CUB和Oxford-102的测试集中每个类别随机选择50个文本描述

• 对于每个描述,使用模型生成5个图像

• 在相同的文本描述下,10个评测者对不同模型输出的结果进行排名


模型对比


模型比较

• 对于CUB、Oxford-102和COCO三个数据集,StackGAN在客观和主观评价上都取得了最佳结果

• GAN-INT-CLS只能生成64*64分辨率的图像,缺乏图像细节,得分较低

• GAWWN虽然可以取得更高的得分,但需要使用额外的输入信息,否则无法取得任何有意义的输出,并且得分仍然低于StackGAN




• 阶段1的GAN能够绘制对象的粗略形状和颜色,但一般模糊不清,缺少细节并带有各种缺陷,特别是对于前景目标

• 阶段2的GAN会在阶段1的基础上进一步补充细节,并且在阶段1没能绘制出合理的形状时,仍然能生成合理的对象

• 使用阶段2的判别器来提取生成图像和真实图像的特征,以寻找离生成图像最接近的真实图像,结果表明,生成的结果并不是简单的复制真实图像



论文总结


• 提出了堆叠的GAN网络,结合条件增强方法,能够生成照片级的图像

• 其中阶段1的GAN网络根据给定的文本描述,来生成颜色和形状基本满足要求的草图

• 阶段2的GAN网络,能够纠正阶段1结果的缺陷,并增加更多细节

• 一系列实验显示,与现有的文本到图像方法相比,StackGAN能生成具有更高分辨率更多细节和多样性的目标图像


论文总结


• 提出了堆叠的GAN网络,结合条件增强方法,能够生成照片级的图像

• 其中阶段1的GAN网络根据给定的文本描述,来生成颜色和形状基本满足要求的草图

• 阶段2的GAN网络,能够纠正阶段1结果的缺陷,并增加更多细节

• 一系列实验显示,与现有的文本到图像方法相比,StackGAN能生成具有更高分辨率更多细节和多样性的目标图像


目录
相关文章
|
2月前
|
机器学习/深度学习 决策智能
2024年1月论文推荐
2024年1月论文推荐
68 1
|
2月前
|
机器学习/深度学习 人工智能 计算机视觉
2023年12月 论文推荐
12月已经过了一半了,还有2周就是2024年了,我们来推荐下这两周我发现的一些好的论文,另外再推荐2篇很好的英文文章。
135 1
|
11月前
|
机器学习/深度学习 自然语言处理 算法
WikiRank论文解读
WikiRank是2018年提出来的,作者认为背景知识可以提供文档的有价值信息,但是它们很少呗应用到关键词抽取任务中来。
72 0
|
11月前
|
算法 搜索推荐 数据挖掘
CollabRank论文解读
以前的方法通常对单个文档单独执行关键字短语提取任务,而不对每个文档进行交互,假设文档被视为彼此独立。
66 0
|
2月前
|
人工智能 Unix 开发工具
vimtutor阅读笔记
csdn博客搬运 vim 常用操作
35 0
|
11月前
|
机器学习/深度学习 编解码 自然语言处理
Segmenter论文解读
图像分割通常在单个图像patch的级别上是模糊的,并且需要上下文信息来达成标签共识。本文介绍了一种用于语义分割的transformer模型——segmenter。
252 0
|
11月前
|
算法 数据挖掘
TopicRank论文解读
TopicRank是2013年的一种无监督关键词抽取算法,其还是一种基于图的关键词抽取算法,主要创新点在于会依赖文档的主题进行辅助辅助排序。候选关键词将以主题进行划分,被用作完整的词图节点。
121 0
|
自然语言处理 算法 搜索推荐
2023年3月的10篇论文推荐
三月有很多的重大产品发布,包括刚刚发布的GPT4,还有Meta刚发布就被泄露的LLaMA,midjourney V5,还有ChatGPT的API(非常便宜)等等。
255 0
|
机器学习/深度学习 编解码 监控
BigGAN-论文阅读笔记
BigGAN-论文阅读笔记
174 0
BigGAN-论文阅读笔记
|
机器学习/深度学习 编解码 自然语言处理
StackGAN 论文阅读笔记(一)
StackGAN 论文阅读笔记(一)
74 0
StackGAN 论文阅读笔记(一)