DCGAN-论文阅读笔记(三)

简介: DCGAN-论文阅读笔记(三)

隐空间分析


隐变量空间漫游

在latent space上walking,可以判断出模型是否是单纯在记住输入(如果生成图像过渡非常sharp),以及模式崩溃的方式

如果在latent space中walking导致生成图像的语义变化(例如添加或删除了对象),我们可以推断模型已经学习到了相关和有趣的表征



去除特定的对象

为了研究模型是如何对图像中的特定物体进行表征的,尝试从生成图像中把窗口进行移除

选出150个样本,手动标注了52个窗口的bounding box

在倒数第二层的conv layer features中,训练一个简单的逻辑回归模型,来判断一个feature activation是否在窗口中

使用这个模型,将所有值大于0的特征(总共200个),都从空间位置中移除



人脸样本上的矢量运算

vector(”King”) - vector(”Man”) +vector(”Woman”)的结果和向量Queen很接近

对单个样本进行操作的结果不是很稳定,而如果使用三个样本的平均值,结果就会好很多



总结展望


• 提出了一套更稳定的架构来训练生成对抗性网络

• 展示了对抗性网络可以很好的学习到图像的表征,并使用在监督学习和生成式的建模上

• 模式崩溃问题仍然存在

• 可以再延伸应用到其他领域,例如视频(做帧级的预测)和声频(用于语音合成的预训练特征)

• 可以对latent space进行更进一步的研究

目录
相关文章
|
6月前
|
机器学习/深度学习 算法 固态存储
【论文泛读】 Deep Learning 论文合集
【论文泛读】 Deep Learning 论文合集
|
机器学习/深度学习 数据可视化 数据挖掘
DCGAN-论文阅读笔记(一)
DCGAN-论文阅读笔记(一)
143 0
DCGAN-论文阅读笔记(一)
|
机器学习/深度学习 编解码 算法
DCGAN-论文阅读笔记(二)
DCGAN-论文阅读笔记(二)
125 0
DCGAN-论文阅读笔记(二)
|
机器学习/深度学习 传感器 自然语言处理
论文笔记:SpectralFormer Rethinking Hyperspectral Image Classification With Transformers_外文翻译
 高光谱(HS)图像具有近似连续的光谱信息,能够通过捕获细微的光谱差异来精确识别物质。卷积神经网络(CNNs)由于具有良好的局部上下文建模能力,在HS图像分类中是一种强有力的特征提取器。然而,由于其固有的网络骨干网的限制,CNN不能很好地挖掘和表示谱特征的序列属性。
169 0
|
机器学习/深度学习 自然语言处理 数据库
CGAN-论文阅读笔记
CGAN-论文阅读笔记
166 0
CGAN-论文阅读笔记
|
机器学习/深度学习 编解码 计算机视觉
StackGAN 论文阅读笔记(三)
StackGAN 论文阅读笔记(三)
102 0
StackGAN 论文阅读笔记(三)
|
机器学习/深度学习 编解码 自然语言处理
StackGAN 论文阅读笔记(一)
StackGAN 论文阅读笔记(一)
96 0
StackGAN 论文阅读笔记(一)
|
机器学习/深度学习 编解码 算法
DGP 论文阅读笔记
DGP 论文阅读笔记
242 0
DGP 论文阅读笔记
|
机器学习/深度学习 编解码 自然语言处理
StackGAN 论文阅读笔记(二)
StackGAN 论文阅读笔记(二)
82 0
StackGAN 论文阅读笔记(二)
|
机器学习/深度学习 编解码 测试技术
论文阅读笔记 | Transformer系列——DeiT
论文阅读笔记 | Transformer系列——DeiT
736 0
论文阅读笔记 | Transformer系列——DeiT