DCGAN-论文阅读笔记(一)

简介: DCGAN-论文阅读笔记(一)

DCGAN-论文阅读笔记


Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks-ReadPaper论文阅读平台


论文结构


1.Introduction

2.Related work

2.1 Representation learning from unlabeled data

2.2 Generating natural images

2.3 Visualizing the internals of CNNs

3.Approach and model architecture

4.Details of adversarial training

4.1 LSUN

4.1.1 Deduplication

4.2 Faces

4.3 Imagenet-1k

5.Empirical validation of DCGANs capabilities

5.1 Classifying CIFAR-10 using GANs as a feature extractor

5.2 Classifying SVHN digits using GANs as a feature

extractor

6.Investigating and visualizing the internals of the networks

6.1 Walking in the latent space

6.2 Visualizing the discriminator features

6.3 Manipulating the generator representation

6.3.1 Forgetting to draw certain objects

6.3.2 Vector arithmetic on face samples

7.Conclusion and future work


摘要


Abstract: In recent years, supervised learning with convolutional networks (CNNs) has seen huge adoption in computer vision applications. Comparatively, unsupervised learning with CNNs has received less attention. In this work we hope to help bridge the gap between the success of CNNs for supervised learning and unsupervised learning. We introduce a class of CNNs called deep convolutional generative adversarial networks (DCGANs), that have certain architectural constraints, and demonstrate that they are a strong candidate for unsupervised learning. Training on various image datasets, we show convincing evidence that our deep convolutional adversarial pair learns a hierarchy of representations from object parts to scenes in both the generator and discriminator. Additionally, we use the learned features for novel tasks - demonstrating their applicability as general image representations


摘要核心

1.希望能让CNN在无监督学习上,达到与监督学习一样的成功

2.通过架构约束,构建了深度卷积生成对抗网络(DCGAN)

3.证明了DCGAN是目前先进的无监督学习网络

4.证明了DCGAN的生成器和判别器学习到了从物体细节到整体场景的多层次表征

5.证明了DCGAN判别器提取的图像特征具有很好的泛化性


研究背景


表征学习

•表征(representation)、特征(feature)、编码(code)



好的表征


具有很强的表示能力,即同样大小的向量可以表示更多信息


使后续的学习任务变得简单,即需要包含更高层的语义信息


具有泛化性,可以应用到不同领域


表征学习的方式


无监督表征学习

有监督表征学习


模型可解释性

—— Interpretation is the process of giving explanations to Human

决策树就是一个具有良好可解释性的模型

使用特征可视化方法

使用数据分析,可以找到数据中一些具有代表性和不具代表性的样本

NIPS 2017会议上,Yann LeCun:人类大脑是非常有限的,我们没有那么多脑容量去研究所有东西的可解释性


研究成果




目录
相关文章
使用ffmpeg工具下载m3u8类型的视频到本地
使用ffmpeg工具下载m3u8类型的视频到本地
1496 0
使用ffmpeg工具下载m3u8类型的视频到本地
|
机器学习/深度学习 编解码 算法
【动手学计算机视觉】第九讲:传统目标检测之DPM模型
DPM模型在我心里的印象一直都非常深刻,不仅是因为它非常经典,此外,它是我进入CV领域看的第一篇文章。还记得当初开始做项目时,老师就发给我一篇文章,并反复声明,要认真研究,好好学习。我反复把这篇文章看了很多遍,也把源码看了几遍,真是深深的被这个神作惊叹到了。真不愧为传统目标识别领域的经典之作,虽然时间过去很多年,特征提取加机器学习这一套在效率上远不如深度学习,但是DPM的影响力和思想依然非常有生命力,从后面深度学习模型中经常可以看到DPM的身影,DPM的原文从2009年至今引用已经超过8000次,它的价值可见一斑,下面就来介绍一下这个经典的目标检测模型。
【动手学计算机视觉】第九讲:传统目标检测之DPM模型
|
监控 关系型数据库 MySQL
MySQL创建索引的注意事项
在数据库设计和优化中,索引的合理使用是提高查询性能和加速数据检索的关键因素之一。通过选择适当的列、了解数据分布、定期维护和监控索引性能,我们能够最大程度地发挥索引的优势,提高数据库的效率和响应速度。
374 0
|
计算机视觉 Python
OpenCV中图像的掩模、加法运算讲解与实战(附Python源码)
OpenCV中图像的掩模、加法运算讲解与实战(附Python源码)
944 0
|
机器学习/深度学习 算法 计算机视觉
经典神经网络论文超详细解读(五)——ResNet(残差网络)学习笔记(翻译+精读+代码复现)
经典神经网络论文超详细解读(五)——ResNet(残差网络)学习笔记(翻译+精读+代码复现)
5425 1
经典神经网络论文超详细解读(五)——ResNet(残差网络)学习笔记(翻译+精读+代码复现)
|
关系型数据库 MySQL 数据库
mysql的用户管理和权限控制
本文介绍了MySQL中用户管理的基本操作,包括创建用户、修改密码、删除用户、查询权限、授予权限和撤销权限的方法。
456 2
|
安全 Python
Python 中的全局解释器锁(GIL)详解
【8月更文挑战第24天】
376 0
|
负载均衡 前端开发 应用服务中间件
前端开发者必备:Nginx入门实战宝典,从部署到优化一网打尽(1)
前端开发者必备:Nginx入门实战宝典,从部署到优化一网打尽
466 1
|
人工智能 数据可视化 前端开发
前端可视化的发展趋势是什么?
【8月更文挑战第4天】前端可视化的发展趋势是什么?
228 5
|
机器学习/深度学习 并行计算 算法
Transformer 一起动手编码学原理
学习Transformer,快来跟着作者动手写一个。
94446 9