超分数据集概述和超分经典网络模型总结

简介: 超分数据集概述和超分经典网络模型总结

前言

参考论文:A Review of Single Image Super-Resolution Reconstruction Based on Deep Learning


一、常用数据集概述

      现有的数据集主要分为两种类型

1、只采集HR图像的数据集,如DIV2K,DIV8K等数据集,对于此类数据集可采用不同的退化方式获取相应的LR图像,从而构造匹配的LR-HR训练图像对,以这种方式获得的训练数据集一般被称为合成数据集。

2、直接采集同一场景不同分辨率的图像,从而获取LR-HR图像对的数据集,如RealSR,DRealSR等数据集,这类训练数据集一般被称为真实数据集。

相较于合成数据集,真实数据集通常具有更真实的退化过程,适用于真实场景图像的超分辨率重建. 但真实数据集的构建存在一定难度,如真实数据集直接采集到的LR-HR图像对通常是不匹配的,需要进行严格的配准操作才能得到具有相同视场且可用于训练的LR-HR图像对,且真实世界图像的退化核会随着景深的变化而变化,通常是不均匀的,往往需要根据实际情况采取不同的策略再进行超分辨率重建。

图像超分辨率重建常用数据集概述

数据集名称 图像数量/张 合成/真实数据集(训练集/验证集/测试集) 图像格式 图像内容
T91 91 合成数据集(训练集) PNG 包括动植物、人、车等局部纹理图像
Timofte 110 合成数据集(训练集) PNG 包括T91,Set15和Set14三个数据集的图像
291-images 291 合成数据集(训练集) PNG,JPG 包括T91和BSD两个数据集的图像
General-100 100 合成数据集(训练集) BMP 包括建筑纹理、动植物、人、食物、日用品等图像
MSCOCO 328 000 合成数据集(训练集) JPG 包括91种易识别物体类型在自然环境中的复杂日常场景的图像
ImageNet 3200 000 合成数据集(训练集) JPG 包括动植物、交通工具、家具、乐器、地质构造、工具等图像
DIV2K 1 000 合成数据集(800张训练集、100张验证集、100张测试集) PNG 包括人、手工艺品、环境(城市、村庄)、动植物、自然风景等图像
Flickr2K 2650 合成数据集(训练集) PNG 包括人、车、动植物、食物、建筑和风景等图像
DF2K 3450 合成数据集(训练集) PNG 包括DIV2K和Flickr2K两个数据集的图像
DPED 5827 真实数据集(5614张训练集、113张验证集、100张测试集) PNG 包括各种道路交通场景(建筑、植物、道路等)等图像
OutdoorScene(OST) 10624 合成数据集(10324张数据集、300张测试集,即OST300) PNG 包括动物、建筑、草、山、植物、天空和水等7类纹理丰富的图像
DIV8K 1504 真实数据集(1304张训练集、100张验证集、100张测试集) PNG 包括人、动物、建筑和风景等各种场景和物体的图像
RealSR 595 真实数据集(550张训练集、45张测试集) PNG 包括建筑、风景、动植物、海报、物体等纹理丰富的室内外场景图像
DRealSR

88(x2)

78(x3)

84(x4)

真实数据集(对于尺度因子2,3,4分别用83,84,93张图像进行测试,其余用于训练) PNG 包括广告海报、植物、办公室、建筑物、等室内外场景的图像
Set5 5 合成数据集(测试集) PNG 包括婴儿、鸟、蝴蝶、头部和女士等5张图像
Set14 14 合成数据集(测试集) PNG 包括动植物、风景(船和桥)、PPT和人等图像
Berkeley Segmentation Dataset(BSD)/BSD500 500 合成数据及(测试集) PNG 包括动物、建筑、食物、风景、人和植物等图像,BSD100和BSD300分别是BSD500中常用的100或300张图片
Urban100 100 合成数据集(测试集) PNG 包括不同类型的建筑图像
Manga109 109 合成数据集(测试集) PNG 包括来自日本漫画书的图像
PIRM 200 合成数据集(100张验证集、100张测试集) PNG 包括人、物、环境、植物、自然风景等图像
DIV2KRK 100 合成数据集(测试集) PNG 包括对DIV2K验证集的100张图像进行更复杂退化操作的图像
DIV2K4D 400 合成数据集(测试集) PNG 包括对100张DIV2K验证集采取四种退化的图像

二、经典网络模型总结

LR图像获取方式:Bi⁃cubic表示双三次下采样,B表示模糊核,GB表示高斯模糊核,N表示噪声,GN表示高斯噪声,J表示JPEG压缩. 由于数据增强能够扩大数据容量,减少迭代次数,并在一定程度上提升网络性能,所以许多网络模型常通过随机翻转、旋转和缩放等操作对数据集进行数据增强.

基于深度学习的单帧图像超分辨率重建典型网络模型总结

网络名称--发表时间(类型) 网络框架(上采样方法) 训练集

LR图像获取方式

数据增强 测试集 损失函数 评价指标
SRCNN--2014(基于S-CNN) 预上采样(双三次插值) 91-images,ImageNet Bicubic+GB —— Set5,Set14 L2 PSNR,SSIM,runtime
FSRCNN--2016(基于S-CNN) 后上采样(反卷积) 91-images,General-100 下采样 缩放、旋转 Set5,Set14,BSD200 L2 PSNR,SSIM,IFC,runtime
ESPCN--2016(基于S-CNN) 后上采样(亚像素卷积) ImageNet 下采样+GB —— 91-images,Set5,Set14,BSD300,BSD500,super texture L2 PSNR,runtime
VDSR--2016(基于ResNet) 预上采样(双三次插值) 291-images 下采样 旋转、翻转 Set5,Set14,Urban100,B100 L2 PSNR,SSIM,runtime
RED-Net--2016(基于ResNet) 预上采样(双三次插值) BSD300 下采样 旋转、翻转 Set5,Set14,BSD100 L2 PSNR,SSIM
DRCN--2016(基于RNN) 预上采样(双三次插值) 91-images 下采样 —— Set5,Set14,B100,Urban100 L2 PSNR,SSIM
LapSRN--2017(基于ResNet) 渐进式上采样(转置卷积) 291-images Bicubic 翻转、旋转 Set5,Set14,B100,Urban100,DIV2K

LCharbonnier 

PSNR,SSIM,IFC

EDSR--2017(基于ResNet) 后上采样(亚像素卷积) DIV2K Bicubic 翻转、旋转 Set5,Set14,B100,Urban100,DIV2K L1 PSNR,SSIM
DRRN--2017(基于RNN) 预上采样(双三次插值) 291-images 下采样 翻转、旋转 Set5,Set14,BSD100,Urban100 L2 PSNR,SSIM,IFC
SRDenseNet--2017(基于DenseNet) 后上采样(反卷积) ImageNet Bicubic —— Set5,Set14,B100,Urban100 L2 PSNR,SSIM
MemNet--2017(基于DenseNet) 预上采样(双三次插值) 291-images Bicubic 翻转、旋转 Set5,Set14,BSD100,Urban100 L2 PSNR,SSIM
SRGAN--2017(基于GAN) 后上采样(亚像素卷积) ImageNet Bicubic —— Set5,Set14,BSD100 Lpercep,LGAN PSNR,SSIM,MOS
EnhanceNet--2017(基于GAN) 后上采样(最近邻插值) MSCOCO Bicubic —— Set5,Set14,BSD100,Urban100

Lpercep,LGAN,Ltexture

PSNR,SSIM,IFC,MOS
DBPN--2018(基于ResNet) 迭代式上下采样(反卷积) DIV2K,Flickr2K,ImageNet Bicubic —— Set5,Set14,BSDS100,Urban100,Manga109 L2 PSNR,SSIM
MSRN--2018(基于ResNet) 后上采样(亚像素卷积) DIV2K Bicubic 缩放、旋转、翻转 Set5,Set14,B100,Urban100,Manga109 L1 PSNR,SSIM
RCAN--2018(基于AM) 后上采样(亚像素卷积) DIV2K

①Bicubic

②模糊下采样

旋转、翻转 Set5,Set14,B100,Urban100,Manga109 L1 PSNR,SSIM
ESRGAN--2018(基于GAN) 后上采样(最近邻插值) DIV2K,Flickr2K,OST Bicubic 翻转、旋转 Set5,Set14,BSD100,Urban100,PIRM Lpercep,LGAN,L1 PSNR,PI
LP-KPN--2019(基于ResNet) 渐进式上采样(shuffle upsample)

RealSR

—— 旋转、翻转 RealSR L2 PSNR,SSIM
SRFBN--2019(基于RNN) 后上采样(反卷积) DIV2K,Flickr2K

①Bicubic

②下采样+GB

③Bicubic+GN

翻转、旋转 Set5,Set14,B100,Urban100,Manga109 L1 PSNR,SSIM
Meta-SR--2019(基于DenseNet) 后上采样(元上采样) DIV2K 下采样 翻转、旋转

Set14,B100,Manga109,DIV2K

L1

PSNR,SSIM

SAN--2019(基于AM) 后上采样(亚像素卷积) DIV2K

①Bicubic

②模糊下采样

旋转、翻转 Set5,Set14,BSD100,Urban100,Manga109 L1 PSNR,SSIM

DAN--2020(基于ResNet)

后上采样(亚像素卷积) DIV2K,Flickr2K

①GB+下采样

②GB(旋转、噪声、归一化)+下采样

——

①Set5,Set14,Urban100,BSD100,Manga109

②DIV2KRK

L1 PSNR,SSIM
HDRN--2020(基于DenseNet) 后上采样(亚像素卷积) DIV2K Bicubic 翻转、旋转 Set5,Set14,BSD100,Urban100,Manga109,Jilin-1 satellite imagery, Kaggle LCharbonnier PSNR,SSIM
CDC-2020(基于AM) 渐进式上采样(亚像素卷积) RealSR,DRealSR —— —— RealSR,DRealSR

LGW(L1)

PSNR,SSIM,LPIPS

RealSR--2020(无监督式) 后上采样(最近邻插值)

①DF2K

②DPED

无监督式

退化模型

——

①DF2K

②DPED

L1,Lpercep,LGAN

①PSNR,SSIM,LPIPS

②MOR

RFB-ESRGAN--2020(基于GAN) 后上采样(交替使用最近邻插值和亚像素卷积)

DIV8K,DIV2K,Flickr2K,OST

Bicubic 翻转、旋转 DIV8K L1,LVGG,LGAN PSNR,SSIM,LPIPS,PI
CRN--2021(基于ResNet) 后上采样(亚像素卷积) DIV2K Bicubic —— Set5,Set14,B100,Urban100 L1 PSNR,SSIM
SMSR--2021(基于LN) 后上采样(亚像素卷积+双三次插值) DIV2K 下采样 旋转、翻转 Set5,Set14,B100,Urban100,Manga109

L1,Lreg

PSNR,SSIM,Params,FlOPS

BSRGAN--2021(基于GAN) 后上采样(最近邻插值) DIV2K,Flickr2K,WED,FFHQ B+下采样+N ——

①合成的DIV2K4D,

②真实的RealSRSet

L1,Lpercep,LPatchGAN

①PSNR,LPIPS

②NIQE,NRQM,PI

Real-ESRGAN--2021(基于GAN)

后上采样(最近邻插值) DIV2K,Flickr2K,OST

Bicubic+B+N+J

—— RealSR,DRealSR,OST300,DPED,ADE20K L1,Lpercep,LGAN 视觉效果
IPT--2021(基于Transformer) —— ImageNet Bicubic —— Set5,Set14,B100,Urban100 L1,Lcontrastive PSNR
SwinIR--2021(基于Transformer) 后上采样(亚像素卷积) DIV2K,Flickr2K

①Bicubic

②B+下采样+N

—— Set5,Set14,Urban100,BSD100,Manga109

①L1

②L1,LGAN,Lpercep

PSNR,SSIM,Params,Mult-Adds


目录
相关文章
|
2天前
|
监控 安全 BI
什么是零信任模型?如何实施以保证网络安全?
随着数字化转型,网络边界不断变化,组织需采用新的安全方法。零信任基于“永不信任,永远验证”原则,强调无论内外部,任何用户、设备或网络都不可信任。该模型包括微分段、多因素身份验证、单点登录、最小特权原则、持续监控和审核用户活动、监控设备等核心准则,以实现强大的网络安全态势。
|
27天前
|
机器学习/深度学习 运维 安全
图神经网络在欺诈检测与蛋白质功能预测中的应用概述
金融交易网络与蛋白质结构的共同特点是它们无法通过简单的欧几里得空间模型来准确描述,而是需要复杂的图结构来捕捉实体间的交互模式。传统深度学习方法在处理这类数据时效果不佳,图神经网络(GNNs)因此成为解决此类问题的关键技术。GNNs通过消息传递机制,能有效提取图结构中的深层特征,适用于欺诈检测和蛋白质功能预测等复杂网络建模任务。
58 2
图神经网络在欺诈检测与蛋白质功能预测中的应用概述
|
1月前
|
存储 网络协议 安全
30 道初级网络工程师面试题,涵盖 OSI 模型、TCP/IP 协议栈、IP 地址、子网掩码、VLAN、STP、DHCP、DNS、防火墙、NAT、VPN 等基础知识和技术,帮助小白们充分准备面试,顺利踏入职场
本文精选了 30 道初级网络工程师面试题,涵盖 OSI 模型、TCP/IP 协议栈、IP 地址、子网掩码、VLAN、STP、DHCP、DNS、防火墙、NAT、VPN 等基础知识和技术,帮助小白们充分准备面试,顺利踏入职场。
83 2
|
1月前
|
运维 网络协议 算法
7 层 OSI 参考模型:详解网络通信的层次结构
7 层 OSI 参考模型:详解网络通信的层次结构
106 1
|
1月前
|
网络协议 算法 网络性能优化
计算机网络常见面试题(一):TCP/IP五层模型、TCP三次握手、四次挥手,TCP传输可靠性保障、ARQ协议
计算机网络常见面试题(一):TCP/IP五层模型、应用层常见的协议、TCP与UDP的区别,TCP三次握手、四次挥手,TCP传输可靠性保障、ARQ协议、ARP协议
|
21天前
|
SQL 存储 安全
网络安全与信息安全概述####
本文探讨了网络安全(Cybersecurity)和信息安全(Information Security)的基本概念及其差异,重点介绍了网络安全漏洞、加密技术及安全意识在信息保护中的重要性。本文旨在通过深入分析这些关键技术和策略,提升对信息安全整体性的理解,帮助读者在数字化时代更好地应对信息安全挑战。 ####
|
1月前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
85 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 编解码 算法
【深度学习】经典的深度学习模型-01 开山之作:CNN卷积神经网络LeNet-5
【深度学习】经典的深度学习模型-01 开山之作:CNN卷积神经网络LeNet-5
48 0
|
4天前
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
41 17
|
14天前
|
存储 SQL 安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将介绍网络安全的重要性,分析常见的网络安全漏洞及其危害,探讨加密技术在保障网络安全中的作用,并强调提高安全意识的必要性。通过本文的学习,读者将了解网络安全的基本概念和应对策略,提升个人和组织的网络安全防护能力。