致敬何凯明的暗通道去雾算法 | NAS-Net: 基于非对齐监督的图像去雾框架

本文涉及的产品
文件存储 NAS,50GB 3个月
简介: 致敬何凯明的暗通道去雾算法 | NAS-Net: 基于非对齐监督的图像去雾框架

640.png

Title: Non-aligned supervision for Real Image Dehazing

Paper: https://arxiv.org/pdf/2303.04940.pdf

Code: https://github.com/hello2377/NSDNet

导读

今天介绍的这篇论文是一篇关于图像去雾相关的工作,本质上应该属于Low-Level领域的范畴。相比于图像分类、语义分割和目标检测等这类研究广泛的内容而言,Dehazing相对来说还是算比较小众的领域,严可能大多数人听过该领域的唯一印象是关于何凯明的暗通道去雾算法(CVPR'2009 Best Paper)。

众所周知,模糊图像对计算机视觉应用,诸如目标检测、语义分割、深度估计、场景解析等影响还是蛮大的,因此研究如何从模糊输入中恢复清晰图像的图像去雾算法整体来说还是一个非常有意义和挑战性的工作。本文主要基于图像去雾任务的几大挑战,提出了一个由dehazing, airlighttransmission 所组成的监督框架以及一个在农村和城市地区使用手机捕获的新模糊数据集Phone-Hazy

由于今天是我们第一次介绍该研究领域,下面笔者将简单梳理下图像去雾的相关进展研究并详细的介绍下本文方法。

图像去雾

图像去雾领域同计算机视觉其它领域一样,也是由传统算法过渡到现如今的基于深度学习的方法。因此,我们可以简单划分为两部分,即基于先验的图像去雾算法和基于深度学习的图像去雾算法。

基于先验的图像去雾算法

基于先验的图像去雾算法同样可根据不同的原理划分为两类,即基于图像增强图像复原的去雾算法。

图像增强

基于图像增强的去雾算法的核心思想是利用一系列图像增强技术,通过对雾图像进行预处理即估计雾的密度(如颜色平衡和白平衡操作等)、通过计算场景中的深度来估计雾的传输因子或者通过一些背景估计算法来估计背景信息,从而还原出清晰的图像。例如FVR[1]算法本身是利用自适应直方图均衡化技术和雾的传输因子来增强原始图像的对比度和清晰度,以去除雾的影响。

图像复原

基于图像复原的去雾算法大都是基于大气退化模型。这是因为大气对图像的影响是主要的雾化因素,导致图像的对比度降低、色彩失真和细节模糊。因此,理解大气对图像的影响,建立适当的大气退化模型,是进行图像去雾的关键。基于大气退化模型的去雾算法通常假设图像中的每个像素都受到相同的大气光影响,且大气的光传播是通过透射率来建模的。这种模型可以根据大气光的强度、大气密度、摄像机高度和视场等参数进行调整,以便更好地恢复出原始图像。

此类方法的典型代表作当属凯明的暗通道图像去雾算法DCP[2]。其通过观察室外自然图像的暗通道,发现在非雾区域的像素在暗通道上的值通常很低几乎接近于0,而雾区域的像素在暗通道上的值通常比较高,因此可以根据这个先验知识来估计雾的密度和分布,

相比于其他基于物理模型的去雾算法,暗通道先验去雾算法的优点在于不需要估计雾的粒子大小和密度等物理参数,只需要计算暗通道和估计全局大气光,因此计算速度非常快。同时,该算法对一些特殊情况,如弱雾、室内等,也有较好的去雾效果。

关于DCP的详细介绍可参考这篇博客:http://qianjiye.de/2015/09/haze-removal-kaiming

基于深度学习的去雾算法

上面我们介绍了基于先验的图像去雾算法,此类方法大都是基于经验观察并人为设定先验。虽然这些方法在一般情况下很有效,但在复杂的现实场景中,特别是在天空区域,DCP因其依赖于特定场景和假设的先验而表现不佳,可能会产生次优的结果。除此之外,一些基于对比度最大化的[3]、基于颜色衰减先验的[4]或者是基于非局部先验的[5],本质上都是一样,极度依赖于专家经验和特定场景。

而基于学习的方法则是使用深度神经网络来学习和估计大气散射模型的参数(即无限空气光、透射图和无雾)或雾霾和清晰图像之间的映射。估计参数一般可直接通过CNNs或者GANs来完成,大多数方法主要采用严重依赖标签数据的监督学习方法,并且主要在人工或算法合成的模糊图像上进行训练。如此一来便会由于域间隙和缺乏真正的模糊/清晰图像对而致使去雾效果并不理想。

另一方面,虽然基于CycleGAN的域自适应(Domain Apation)和不成对的去雾模型在一定程度上能够缓解此类情况,但由于样本分布的差异,这些方法在现实场景中仍然未能获得良好的去雾效果。与域自适应和不成对的监督相比,本文方法通过在成对的真实模糊数据集上进行训练并从未对齐的参考图像中提取有效特征,其性能表现优于先前的去雾模型。此外,作者重新定义了非均匀映射并提出了一种新颖的网络mvSA,可以在现实场景中更准确地估计infinite airlight.

在图像去雾领域中,"infinite airlight"(意指全局大气光 )是指在雾天或大气条件不佳的情况下,由于光线在传播过程中与大气中的水分子或其他微粒发生相互作用,导致图像中出现的一种明亮、模糊和低对比度的效果。这种效果通常是由于大气光的存在而引起的,大气光被认为是一种光线在穿过大气时散射和吸收的结果。

方法

上图为本文所提出非对齐的监督框架图,其基于经典的大气散射模型(atmospheric scattering model)所提出:

如图所示,这是一个由去雾、全局大气光和基于大气散射模型的传输网络组成。其中一个比较关键的想法是使用非对齐图像来监督去雾网络。该框架使用允许与模糊图像不完全对齐的清晰图像用于训练。通过放宽严格的对齐约束,在更宽松的条件下从同一场景收集未对齐的图像对变得更加容易。

首先,本文探索了一种非对齐的监督设置,以使用清晰且非对齐的参考图像来训练去雾网络。其次,为了更有效地对模糊图像中存在的  进行建模,本文提出了均值和方差自注意力(mean and variance Self-Attention, mvSA)网络。通过结合暗通道先验(DCP)和模糊图像,mvSA 能够通过计算它们的平均值并预测由于波长和散射粒子的影响而引起的变化来突出模糊特征。此外,与DCP和自注意力机制相比,本文所提出的mvSA网络更准确地限制了全局大气光的范围。

去雾网络

去雾网络是将输入的有雾图像直接生成无雾图像。如图2所示,我们使用DCP方法计算出一个粗糙的无雾图像,然后将其放入去雾网络。它的架构是一个共享的生成器网络。有关详细信息,请参阅CycleGAN的生成器。

传输网络

传输网络是通过使用图2中的输入模糊图像的通道注意网络来生成三通道传输图。其体系结构是编码器-解码器结构,具有跨特征尺度的跳跃连接。最终的传输图可以通过引导滤波器获得。

损失函数

整体的损失函数如下:

此处, 和  分别为对应的多尺度参考损失(multi-scale reference loss)和重建损失(reconstruction loss)。

其中,多尺度参考损失主要结合了对抗损失和上下文损失,充分利用多尺度上下文信息来更好的优化去雾网络。另一方面,重建损失不仅可以监督全局大气光、传输和去雾网络的训练,还可以保持去雾结果的特征独立于未对齐的参考图像。

实验

Phone-hazy dataset

Non-aligned image pairs in real-world scenes

Compare with the latest SOTA methods

qualitative resultsquantitative results

More visualization results of NSDNet

总结

本文使用非对齐监督的真实世界图像提出了一种新颖有效的去雾框架。该框架利用多尺度参考损失将去雾网络的预测与清晰且未对齐的参考图像进行比较。它可以从现实环境中收集模糊/清晰的图像对,即使它们没有完全对齐。此外,所提框架包括一个均值和方差自注意力网络,该网络在改进空气光均值和变化的估计之前使用暗通道。最终,实验结果表明,所提方法对真实世界图像进行去雾方面优于最先进的方法。

相关实践学习
基于ECS和NAS搭建个人网盘
本场景主要介绍如何基于ECS和NAS快速搭建个人网盘。
阿里云文件存储 NAS 使用教程
阿里云文件存储(Network Attached Storage,简称NAS)是面向阿里云ECS实例、HPC和Docker的文件存储服务,提供标准的文件访问协议,用户无需对现有应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布式文件系统。 产品详情:https://www.aliyun.com/product/nas
目录
相关文章
|
18天前
|
算法 计算机视觉
图像处理之积分图应用四(基于局部均值的图像二值化算法)
图像处理之积分图应用四(基于局部均值的图像二值化算法)
23 0
|
1天前
|
算法 计算机视觉
基于Chan-Vese算法的图像边缘提取matlab仿真
**算法预览展示了4幅图像,从边缘检测到最终分割,体现了在matlab2022a中应用的Chan-Vese水平集迭代过程。核心代码段用于更新水平集并显示迭代效果,最后生成分割结果及误差曲线。Chan-Vese模型(2001)是图像分割的经典方法,通过最小化能量函数自动检测平滑区域和清晰边界的图像分割,适用于复杂环境,广泛应用于医学影像和机器视觉。**
|
8天前
|
机器学习/深度学习 人工智能 算法
【CVPR2024】面向StableDiffusion的编辑算法FreePromptEditing,提升图像编辑效果
近日,阿里云人工智能平台PAI与华南理工大学贾奎教授团队合作在深度学习顶级会议 CVPR2024 上发表 FPE(Free-Prompt-Editing) 算法,这是一种面向StableDiffusion的图像编辑算法。在这篇论文中,StableDiffusion可用于实现图像编辑的本质被挖掘,解释证明了基于StableDiffusion编辑的算法本质,并基于此设计了新的图像编辑算法,大幅度提升了图像编辑的效率。
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
【CVPR2024】阿里云人工智能平台PAI图像编辑算法论文入选CVPR2024
近期,阿里云人工智能平台PAI发表的图像编辑算法论文在CVPR-2024上正式亮相发表。论文成果是阿里云与华南理工大学贾奎教授领衔的团队共同研发。此次入选标志着阿里云人工智能平台PAI自主研发的图像编辑算法达到了先进水平,赢得了国际学术界的认可。在阿里云人工智能平台PAI算法团队和华南理工大学的老师学生们一同的坚持和热情下,将阿里云在图像生成与编辑领域的先进理念得以通过学术论文和会议的形式,向业界传递和展现。
|
15天前
|
存储 编解码 算法
C#.NET逃逸时间算法生成分形图像的毕业设计完成!晒晒功能
该文介绍了一个使用C#.NET Visual Studio 2008开发的程序,包含错误修复的Julia、Mandelbrot和优化过的Newton三种算法,生成色彩丰富的分形图像。作者改进了原始算法的效率,将内层循环的画点操作移至外部,提升性能。程序提供五种图形模式,支持放大缩小及颜色更新,并允许用户自定义画布大小以调整精度。还具备保存为高质JPG的功能。附有四张示例图片展示生成的分形效果。
|
16天前
|
存储 机器学习/深度学习 算法
python 五种算法转置后翻转、层次旋转、递归分块、一次性旋转、环状替换 实现旋转图像【力扣题48】
python 五种算法转置后翻转、层次旋转、递归分块、一次性旋转、环状替换 实现旋转图像【力扣题48】
|
27天前
|
算法 数据安全/隐私保护 C++
基于二维CS-SCHT变换和扩频方法的彩色图像水印嵌入和提取算法matlab仿真
该内容是关于一个图像水印算法的描述。在MATLAB2022a中运行,算法包括水印的嵌入和提取。首先,RGB图像转换为YUV格式,然后水印通过特定规则嵌入到Y分量中,并经过Arnold置乱增强安全性。水印提取时,经过逆过程恢复,使用了二维CS-SCHT变换和噪声对比度(NC)计算来评估水印的鲁棒性。代码中展示了从RGB到YUV的转换、水印嵌入、JPEG压缩攻击模拟以及水印提取的步骤。
|
22天前
|
算法 计算机视觉 Python
使用分水岭算法分割图像
【6月更文挑战第4天】使用分水岭算法分割图像。
15 4
|
19天前
|
算法 计算机视觉
图像处理之图像快速旋转算法
图像处理之图像快速旋转算法
16 1
|
19天前
|
存储 算法 Java
图像分析之连通组件标记算法
图像分析之连通组件标记算法
18 1