备案控制台

开发者社区人工智能文章正文

DCGAN-论文阅读笔记（三）

2023-02-23 104

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： DCGAN-论文阅读笔记（三）

隐空间分析

隐变量空间漫游

•

在latent space上walking，可以判断出模型是否是单纯在记住输入（如果生成图像过渡非常sharp），以及模式崩溃的方式

•

如果在latent space中walking导致生成图像的语义变化（例如添加或删除了对象），我们可以推断模型已经学习到了相关和有趣的表征

去除特定的对象

•

为了研究模型是如何对图像中的特定物体进行表征的，尝试从生成图像中把窗口进行移除

•

选出150个样本，手动标注了52个窗口的bounding box

•

在倒数第二层的conv layer features中，训练一个简单的逻辑回归模型，来判断一个feature activation是否在窗口中

•

使用这个模型，将所有值大于0的特征（总共200个），都从空间位置中移除

人脸样本上的矢量运算

•

vector(”King”) - vector(”Man”) +vector(”Woman”)的结果和向量Queen很接近

•

对单个样本进行操作的结果不是很稳定，而如果使用三个样本的平均值，结果就会好很多

总结展望

• 提出了一套更稳定的架构来训练生成对抗性网络

• 展示了对抗性网络可以很好的学习到图像的表征，并使用在监督学习和生成式的建模上

• 模式崩溃问题仍然存在

• 可以再延伸应用到其他领域，例如视频（做帧级的预测）和声频（用于语音合成的预训练特征）

• 可以对latent space进行更进一步的研究

文章标签：

语音技术

机器学习/深度学习

YuetianW

目录

相关文章

BetterBench

|

5月前

|

机器学习/深度学习算法测试技术

【博士每天一篇文献-算法】iCaRL_ Incremental Classifier and Representation Learning

本文介绍了iCaRL算法，一种增量分类器和表示学习系统，它能够逐步从数据流中学习新概念，通过使用最近均值示例规则、基于牧羊的样本选择和知识蒸馏等方法，在CIFAR-100和ImageNet数据集上展示了其优越的逐步学习能力和对灾难性遗忘的有效抵抗。

BetterBench

62 0 0

热烈的马

|

8月前

|

机器学习/深度学习数据可视化 PyTorch

PyTorch实现DCGAN（生成对抗网络）生成新的假名人照片实战（附源码和数据集）

PyTorch实现DCGAN（生成对抗网络）生成新的假名人照片实战（附源码和数据集）

热烈的马

136 1 1

clichong

|

算法数据可视化计算机视觉

论文阅读笔记 | 目标检测算法——Generalized Focal Lossv1,v2

论文阅读笔记 | 目标检测算法——Generalized Focal Lossv1,v2

clichong

1174 0 0

论文阅读笔记 | 目标检测算法——Generalized Focal Lossv1,v2

YuetianW

|

机器学习/深度学习编解码算法

DCGAN-论文阅读笔记（二）

DCGAN-论文阅读笔记（二）

YuetianW

135 0 0

DCGAN-论文阅读笔记（二）

YuetianW

|

机器学习/深度学习数据可视化数据挖掘

DCGAN-论文阅读笔记（一）

DCGAN-论文阅读笔记（一）

YuetianW

156 0 0

DCGAN-论文阅读笔记（一）

-开发达人-

|

机器学习/深度学习存储人工智能

7 Papers | AAAI22杰出论文、WSDM22最佳论文；200+文献ViT综述

7 Papers | AAAI22杰出论文、WSDM22最佳论文；200+文献ViT综述

-开发达人-

147 0 0

AiCharm

|

机器学习/深度学习传感器自然语言处理

论文笔记：SpectralFormer Rethinking Hyperspectral Image Classification With Transformers_外文翻译

高光谱(HS)图像具有近似连续的光谱信息，能够通过捕获细微的光谱差异来精确识别物质。卷积神经网络(CNNs)由于具有良好的局部上下文建模能力，在HS图像分类中是一种强有力的特征提取器。然而，由于其固有的网络骨干网的限制，CNN不能很好地挖掘和表示谱特征的序列属性。

AiCharm

198 0 0

YuetianW

|

机器学习/深度学习自然语言处理数据库

CGAN-论文阅读笔记

CGAN-论文阅读笔记

YuetianW

173 0 0

YuetianW

|

机器学习/深度学习编解码监控

BigGAN-论文阅读笔记

BigGAN-论文阅读笔记

YuetianW

240 0 0

YuetianW

|

机器学习/深度学习编解码算法

DGP 论文阅读笔记

DGP 论文阅读笔记

YuetianW

257 0 0

热门文章

最新文章

ToC和ToB有啥区别

多中心容灾实践：如何实现真正的异地多活？

时间序列预测：CNN+LSTM+Attention模型实战

DSP_代码笔记（基于TMS320X281x）

Confluence 6 那些文件需要备份

区块链技术将占据全球金融系统核心地位

一个有味道的函数

ceph启动脚本

[CLR via C#]7. 常量和字段

PsycoLLM：开源的中文心理大模型，免费 AI 心理医生，支持心理健康评估与多轮对话

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

Gemini Coder：基于 Google Gemini API 的开源 Web 应用生成工具，支持实时编辑和预览

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

MiniPerplx：基于 Grok 2.0 的开源 AI 搜索引擎，支持网页、学术、视频搜索

CreatiLayout：复旦与字节联合推出布局到图像生成技术，支持高质量图像生成与布局优化

Cosmos：英伟达生成式世界基础模型平台，加速自动驾驶与机器人开发

AIOpsLab：云服务自动化运维 AI，微软开源云服务 AI 框架，覆盖整个生命周期

《docker基础篇：4.Docker镜像》包括是什么、分层的镜像、UnionFS（联合文件系统）、docker镜像的加载原理、为什么docker镜像要采用这种分层结构呢、docker镜像commit

《鸿蒙安全沙箱机制——人工智能应用的安全护盾》

相关电子书

更多

中国地质大学博士学位论文

《SIGIR 顶会论文解读》

Learning Disentangled Representations for Recommendation解读电子书

下一篇

开通oss服务