IJCV收录!深度去模糊综述论文来了

简介: IJCV收录!深度去模糊综述论文来了

机器之心编辑部

本文提出了一个图像去模糊方向的综述,来自澳大利亚国立大学、中山大学、美国加州大学 Merced 分校、日本乐天研究所的研究者回顾了基于深度学习的图像去模糊技术研究进展,回顾了图像去模糊的研究历史,总结了当前的研究进展,并进行了展望。该综述近期被计算机视觉旗舰期刊 International Journal of Computer Vision 接收。


链接:https://link.springer.com/article/10.1007/s11263-022-01633-5


图像去模糊是计算机底层视觉中的一个经典问题,它的目标是将输入的模糊图像中恢复成清晰的图像。近些年,基于深度学习的神经网络在该任务上取得了重大进展。本文对最近发表的基于深度学习的图像去模糊方法进行了全面的回顾,主要看点如下:


1. 阐述图像去模糊的研究背景,包括如何定义去模糊、模糊产生的原因、去模糊的方法、质量评估的指标、常见的数据集。

2. 讨论了近些年基于深度学习在图像去模糊领域中取得的进展,对当前的深度去模糊方法进行全面回顾。

3. 分析了当前图像去模糊存在的挑战以及未来的研究课题。


背景知识


图像模糊是由拍摄图像过程中的各种因素引起,包括相机抖动、目标运动以及离焦等。根据模糊图片的不同,一般将模糊图片分为如下几类:运动模糊,离焦模糊,高斯模糊,以及混合模糊。


(1)运动模糊:在光照充足的条件下,当曝光时间足够短时,相机可以捕捉到清晰的图像。但是,当曝光时间相对于物体或者相机运动过长的时候,图像会产生模糊,该模糊图片一般被称为运动模糊。


(2)离焦模糊:除了运动模糊之外,图像清晰度还受到目标位置以及相机焦距的影响。在相机的成像区域中,不同目标的景深是不同的,当相机的对焦系统无法对焦到某些目标时,相机就会拍摄到离焦模糊的图片。


(3)高斯模糊:高斯模糊是通过高斯卷积得到的一种模糊图像。


(4)混合模糊:当一个图片同时被多种因素影响时,造成的模糊就是混合模糊,比如相机拍摄在离焦状态下的高速运动物体时,得到的模糊就是一种混合模糊。


为了评估去模糊的效果,通常采用一些图片评估算法,这些算法包括基于主观和基于客观的评测。主观方法是不需要清晰图像作参考的,一个具有代表性的指标是 MOS,评测者用 1-5 的等级对图像质量进行评分,之后对分数进行平均。对于图像去模糊的问题,大多数现有方法都是根据基于客观的指标进行评测,该方法可以进一步分为两类:有参考和无参考的指标。有参考的指标通过将恢复的图像与清晰图进行比较来评估图像质量,包括 PSNR,SSIM, WSNR, MS-SSIM、IFC、NQM、UIQI、VIT、LPIPS 等等,其中 PSNR 跟 SSIM 是最常用的指标。


与有参考的指标不同,无参考指标仅使用去模糊的图像就可以衡量其质量。常见的指标包括 BIQI、BLINDS、BRISQUE、CORNIA、NIQE、SSEQ 等。此外,也有人通过测量去模糊算法对不同视觉任务(例如目标检测和识别)准确性的影响,来评估图像去模糊算法的性能。


非盲图像去模糊


图像去模糊的任务是根据给定的模糊图像,恢复潜在的清晰图像。当已知图片模糊核的情况下,则该问题也可以被称为非盲图像去模糊。尽管已知了模糊核,但是由于传感器噪声和高频信息的丢失,该任务仍然具有挑战性。


一些基于非深度学习的方法通常使用自然图像先验,例如全局或者局部图像先验,在空间域 或频域中重建清晰的图像。为了恢复出更好的图片,近些年,一些基于空间反卷积和深度神经网络的方法相继被提出。本文在下面表格中总结了现有的基于深度学习的非盲方法,这些方法可以大致分为两组:第一组是基于反卷积去噪,而第二组是基于先验去噪声:


盲图像去模糊


当模糊图的模糊核未知时,图像去模糊任务被称为盲图像去模糊。早期的盲图像去模糊方法侧重于去除均匀的模糊核。然而,真实世界的模糊图像,其不同区域通常是由不同的模糊核生成,因此其模糊核是非均匀的。为了解决盲图像的去模糊任务,多种基于深度学习的图像去模糊算法被提出。本文在下面表格中总结了现有的基于深度学习的盲图像去模糊方法,这些方法通常采用各种不同的网络框架,包括多尺度网络、对抗神经网络、级联网络、再模糊网络等等。


 

损失函数


为了更好的训练深度去模糊网络,各种各样的损失函数被提出。早期的方法大部分是基于像素级内容的损失函数,用于测量网络训练过程中的去模糊图片跟清晰图片的重建误差。考虑到像素级内容的损失不能准确衡量去模糊图像的质量,各种其他的损失函数被提出,包括基于对抗的损失函数、基于感知的损失函数、基于相对模糊的损失函数、基于光流的损失函数等等。


模型性能对比


本本总结了具有代表性的图像去模糊跟视频去模糊算法在主流数据集上的 PSNR/SSIM 指标。



此外,本文总结了不同损失函数对去模糊方法的影响,模型在 non-reference 的评价指标上的表现,以及模型的速度。


特定场景的图像去模糊


当前,绝大部分基于深度学习的图像去模糊算法是不区分场景的,也就是他们是对常见的自然与人为设计的场景进行去模糊。但是,在现实生活中,经常会遇到一些特定场景的图像去模糊。比如人脸去模糊、文本去模糊、双目去模糊。本文总结了这些不同场景的特点,以及各自的深度去模糊算法。


机遇与挑战


尽管图像去模糊算法在主流数据集上取得了重大进展,但把真实世界的模糊图恢复成清晰的图像仍然具有挑战性。本文最后总结了图像去模糊算法现在面临的挑战并讨论了未来可能的研究机会,包括真实数据采集、损失函数、评价指标、模型规模、无监督学习等等。


感兴趣的读者可以阅读论文原文,了解更多研究细节。

相关文章
|
canal 存储 SQL
MySQL 与 Redis 缓存的同步方案
本文介绍MySQL与Redis缓存的同步的两种方案 方案1:通过MySQL自动同步刷新Redis,MySQL触发器+UDF函数实现 方案2:解析MySQL的binlog实现,将数据库中的数据同步到Redis 一、方案1(UDF)
MySQL 与 Redis 缓存的同步方案
|
机器学习/深度学习 计算机视觉 Python
【DRConv】动态区域感知卷积结构可提升卷积的表示能力 | 复现《Dynamic Region-Aware Convolution》
【DRConv】动态区域感知卷积结构可提升卷积的表示能力 | 复现《Dynamic Region-Aware Convolution》
443 1
【DRConv】动态区域感知卷积结构可提升卷积的表示能力 | 复现《Dynamic Region-Aware Convolution》
|
机器学习/深度学习 数据采集 算法
【BetterBench博士】2024华为杯C题:数据驱动下磁性元件的磁芯损耗建模 Python代码实现
本文介绍了2024年中国研究生数学建模竞赛C题的详细分析,涵盖数据预处理、特征提取、模型训练及评估等多个方面。通过对磁通密度数据的处理,提取关键特征并应用多种分类算法进行波形分类。此外,还探讨了斯坦麦茨方程及其温度修正模型的应用,分析了温度、励磁波形和磁芯材料对磁芯损耗的影响,并提出了优化磁芯损耗与传输磁能的方法。最后,提供了B站视频教程链接,供进一步学习参考。
946 7
【BetterBench博士】2024华为杯C题:数据驱动下磁性元件的磁芯损耗建模 Python代码实现
|
机器学习/深度学习 搜索推荐 Python
L1范数(L1 norm)
L1范数(L1 norm),也称为曼哈顿距离(Manhattan distance)或绝对值范数(Absolute value norm),是向量中各个元素绝对值之和。它在数学和机器学习中经常被用作一种正则化项或稀疏性度量。
2557 2
|
数据安全/隐私保护
matlab后缀带p文件如何打开
MATLAB P文件是一种二进制文件,无法直接被打开和编辑,这就使得调试和修改代码异常困难。然而,MATLAB P文件解密工具可以帮助我们将P文件解密成M文件,还原真实代码。
1302 1
|
机器学习/深度学习 JSON API
【机器学习】GLM-4V:图片识别多模态大模型(MLLs)初探
【机器学习】GLM-4V:图片识别多模态大模型(MLLs)初探
580 0
|
资源调度 算法 机器人
图像处理之高斯一阶及二阶导数计算
图像处理之高斯一阶及二阶导数计算
347 6
|
机器学习/深度学习 人工智能 自然语言处理
深度学习与CV教程(15) | 视觉模型可视化与可解释性
本文讲解了一些理解 CNN 可视化的方法(特征、滤波器可视化),以及一些有趣的应用,如DeepDream、图像神经风格迁移(特征反演 + 纹理生成)等【对应 CS231n Lecture 12】
19229 1
深度学习与CV教程(15) | 视觉模型可视化与可解释性
|
传感器 机器学习/深度学习 监控
物联网技术在工业自动化中的实时故障诊断与维护
物联网技术在工业自动化中的实时故障诊断与维护
|
存储 分布式计算 大数据
使用 Java 进行大数据处理和分析
【4月更文挑战第19天】本文探讨了Java在大数据处理中的关键作用,涉及Hadoop框架、HDFS数据存储、MapReduce编程模型及Spark等数据分析工具。还包括数据预处理、可视化、性能优化、安全与隐私保护以及完整处理流程。Java在金融、医疗、电商等领域有广泛应用,为大数据洞察和决策提供支持,但同时也需要开发者具备深厚的技术背景和实践经验。
876 2