论文笔记之:DualGAN: Unsupervised Dual Learning for Image-to-Image Translation

简介: DualGAN: Unsupervised Dual Learning for Image-to-Image Translation2017-06-12  21:29:06     引言部分:  本文提出一种对偶学习模式的 GAN 网络结构来进行 image to image translation。

 

DualGAN: Unsupervised Dual Learning for Image-to-Image Translation

2017-06-12  21:29:06  

 

  引言部分:

  本文提出一种对偶学习模式的 GAN 网络结构来进行 image to image translation。现有的图像之间转换的方法,大部分都是需要图像对的方法,但是实际上有的场景下,很难得到这样的图像对。如何利用多个 domain 之间的关系,不需要图像对就可以进行图像之间的转换,那将会是一个很 cool 的工作,而本文就是将 GAN 和 Dualing Learning 结合起来完成了该项目,从效果来看,还是可以的。

  

 

  关于 Dualing Learning:

  主要是参考了 NIPS 2016 年的一篇文章,做机器翻译的。是想将 domain A 到 domain B 之间的转换,构成一个闭环(loop)。通过 minimize 该图 和 重构图像之间的 loss 来优化学习的目标。这里也是,给定一个 domain image A,用一个产生器 P 来生成对应的 domain image B,由于没有和A匹配的图像对,这里是没有 GT 的。那么如何衡量 产生器造出的图像 P(A, z) 的质量呢?如何该图伪造的很好,那么反过来,用另一个 产生器 Q,应该可以很好的恢复出该图,即:Q(P(A, z), z') 应该和 A 是类似的,即:|| Q(P(A, z), z') - A ||。对于 domain image B 也是如此,那么有了另一个 重构误差。

  这样,除了在 minimize 两个 产生器的loss的同时,也需要考虑到这两个重构误差,从而使得最终转换的结果有保证。

  

  ==>> Training Target: 

  1. 用 L1 loss 来尽可能使得图像清晰;

  2. 用 两个 GAN 来实现 domain 之间的切换;

  

 

 

 

 

 

 

 

 

相关文章
|
人工智能 自然语言处理 计算机视觉
StyleStudio:支持图像风格迁移的文生图模型,能将融合参考图像的风格和文本提示内容生成风格一致的图像
StyleStudio 是一种文本驱动的风格迁移模型,能够将参考图像的风格与文本提示内容融合。通过跨模态 AdaIN 机制、基于风格的分类器自由引导等技术,解决了风格过拟合、控制限制和文本错位等问题,提升了风格迁移的质量和文本对齐的准确性。
631 8
StyleStudio:支持图像风格迁移的文生图模型,能将融合参考图像的风格和文本提示内容生成风格一致的图像
|
SQL 关系型数据库 MySQL
【揭秘】MySQL binlog日志与GTID:如何让数据库备份恢复变得轻松简单?
【8月更文挑战第22天】MySQL的binlog日志记录数据变更,用于恢复、复制和点恢复;GTID为每笔事务分配唯一ID,简化复制和恢复流程。开启binlog和GTID后,可通过`mysqldump`进行逻辑备份,包含binlog位置信息,或用`xtrabackup`做物理备份。恢复时,使用`mysql`命令执行备份文件,或通过`innobackupex`恢复物理备份。GTID模式下的主从复制配置更简便。
1579 2
|
8月前
|
人工智能 安全 Android开发
手机也能跑通义Qwen3大模型,手把手教你部署!
全球开源模型冠军Qwen3与端到端全模态模型Qwen2.5-Omni现已成功在手机上跑通!借助MNN支持,适配Android、iOS及桌面端,实现低延迟、本地化、高安全的AI体验。用户可通过自定义Sampler设置、System Prompt和Max New Tokens调节模型输出风格与长度。
4095 11
|
机器学习/深度学习 编解码 人工智能
InvSR:开源图像超分辨率生成模型,提升分辨率,修复老旧照片为超清图像
InvSR 是一个创新的图像超分辨率模型,基于扩散模型的逆过程恢复高分辨率图像。它通过深度噪声预测器和灵活的采样机制,能够高效地提升图像分辨率,适用于老旧照片修复、视频监控、医疗成像等多个领域。
2600 9
InvSR:开源图像超分辨率生成模型,提升分辨率,修复老旧照片为超清图像
|
应用服务中间件 持续交付 nginx
[nginx]借助nginx实现自动获取本机IP
[nginx]借助nginx实现自动获取本机IP
310 5
|
并行计算 Ubuntu PyTorch
Ubuntu 18.04 + CUDA 11.3.0 + CUDNN 8.2.1 + Anaconda + Pytorch 1.10(下)
Ubuntu 18.04 + CUDA 11.3.0 + CUDNN 8.2.1 + Anaconda + Pytorch 1.10(上)
700 0
|
运维 监控 网络协议
|
数据处理 索引 Python
Pandas中resample方法:轻松处理时间序列数据
Pandas中resample方法:轻松处理时间序列数据
456 1
|
机器学习/深度学习 编解码 计算机视觉
【一秒梵高】基于OpenCV4实现图像九种风格迁移
【一秒梵高】基于OpenCV4实现图像九种风格迁移
429 0
|
数据可视化 算法 Python
解决matplotlib文字标签遮挡问题
解决matplotlib文字标签遮挡问题
524 0