致敬何凯明的暗通道去雾算法 | NAS-Net: 基于非对齐监督的图像去雾框架

本文涉及的产品
文件存储 NAS,50GB 3个月
简介: 致敬何凯明的暗通道去雾算法 | NAS-Net: 基于非对齐监督的图像去雾框架

640.png

Title: Non-aligned supervision for Real Image Dehazing

Paper: https://arxiv.org/pdf/2303.04940.pdf

Code: https://github.com/hello2377/NSDNet

导读

今天介绍的这篇论文是一篇关于图像去雾相关的工作,本质上应该属于Low-Level领域的范畴。相比于图像分类、语义分割和目标检测等这类研究广泛的内容而言,Dehazing相对来说还是算比较小众的领域,严可能大多数人听过该领域的唯一印象是关于何凯明的暗通道去雾算法(CVPR'2009 Best Paper)。

众所周知,模糊图像对计算机视觉应用,诸如目标检测、语义分割、深度估计、场景解析等影响还是蛮大的,因此研究如何从模糊输入中恢复清晰图像的图像去雾算法整体来说还是一个非常有意义和挑战性的工作。本文主要基于图像去雾任务的几大挑战,提出了一个由dehazing, airlighttransmission 所组成的监督框架以及一个在农村和城市地区使用手机捕获的新模糊数据集Phone-Hazy

由于今天是我们第一次介绍该研究领域,下面笔者将简单梳理下图像去雾的相关进展研究并详细的介绍下本文方法。

图像去雾

图像去雾领域同计算机视觉其它领域一样,也是由传统算法过渡到现如今的基于深度学习的方法。因此,我们可以简单划分为两部分,即基于先验的图像去雾算法和基于深度学习的图像去雾算法。

基于先验的图像去雾算法

基于先验的图像去雾算法同样可根据不同的原理划分为两类,即基于图像增强图像复原的去雾算法。

图像增强

基于图像增强的去雾算法的核心思想是利用一系列图像增强技术,通过对雾图像进行预处理即估计雾的密度(如颜色平衡和白平衡操作等)、通过计算场景中的深度来估计雾的传输因子或者通过一些背景估计算法来估计背景信息,从而还原出清晰的图像。例如FVR[1]算法本身是利用自适应直方图均衡化技术和雾的传输因子来增强原始图像的对比度和清晰度,以去除雾的影响。

图像复原

基于图像复原的去雾算法大都是基于大气退化模型。这是因为大气对图像的影响是主要的雾化因素,导致图像的对比度降低、色彩失真和细节模糊。因此,理解大气对图像的影响,建立适当的大气退化模型,是进行图像去雾的关键。基于大气退化模型的去雾算法通常假设图像中的每个像素都受到相同的大气光影响,且大气的光传播是通过透射率来建模的。这种模型可以根据大气光的强度、大气密度、摄像机高度和视场等参数进行调整,以便更好地恢复出原始图像。

此类方法的典型代表作当属凯明的暗通道图像去雾算法DCP[2]。其通过观察室外自然图像的暗通道,发现在非雾区域的像素在暗通道上的值通常很低几乎接近于0,而雾区域的像素在暗通道上的值通常比较高,因此可以根据这个先验知识来估计雾的密度和分布,

相比于其他基于物理模型的去雾算法,暗通道先验去雾算法的优点在于不需要估计雾的粒子大小和密度等物理参数,只需要计算暗通道和估计全局大气光,因此计算速度非常快。同时,该算法对一些特殊情况,如弱雾、室内等,也有较好的去雾效果。

关于DCP的详细介绍可参考这篇博客:http://qianjiye.de/2015/09/haze-removal-kaiming

基于深度学习的去雾算法

上面我们介绍了基于先验的图像去雾算法,此类方法大都是基于经验观察并人为设定先验。虽然这些方法在一般情况下很有效,但在复杂的现实场景中,特别是在天空区域,DCP因其依赖于特定场景和假设的先验而表现不佳,可能会产生次优的结果。除此之外,一些基于对比度最大化的[3]、基于颜色衰减先验的[4]或者是基于非局部先验的[5],本质上都是一样,极度依赖于专家经验和特定场景。

而基于学习的方法则是使用深度神经网络来学习和估计大气散射模型的参数(即无限空气光、透射图和无雾)或雾霾和清晰图像之间的映射。估计参数一般可直接通过CNNs或者GANs来完成,大多数方法主要采用严重依赖标签数据的监督学习方法,并且主要在人工或算法合成的模糊图像上进行训练。如此一来便会由于域间隙和缺乏真正的模糊/清晰图像对而致使去雾效果并不理想。

另一方面,虽然基于CycleGAN的域自适应(Domain Apation)和不成对的去雾模型在一定程度上能够缓解此类情况,但由于样本分布的差异,这些方法在现实场景中仍然未能获得良好的去雾效果。与域自适应和不成对的监督相比,本文方法通过在成对的真实模糊数据集上进行训练并从未对齐的参考图像中提取有效特征,其性能表现优于先前的去雾模型。此外,作者重新定义了非均匀映射并提出了一种新颖的网络mvSA,可以在现实场景中更准确地估计infinite airlight.

在图像去雾领域中,"infinite airlight"(意指全局大气光 )是指在雾天或大气条件不佳的情况下,由于光线在传播过程中与大气中的水分子或其他微粒发生相互作用,导致图像中出现的一种明亮、模糊和低对比度的效果。这种效果通常是由于大气光的存在而引起的,大气光被认为是一种光线在穿过大气时散射和吸收的结果。

方法

上图为本文所提出非对齐的监督框架图,其基于经典的大气散射模型(atmospheric scattering model)所提出:

如图所示,这是一个由去雾、全局大气光和基于大气散射模型的传输网络组成。其中一个比较关键的想法是使用非对齐图像来监督去雾网络。该框架使用允许与模糊图像不完全对齐的清晰图像用于训练。通过放宽严格的对齐约束,在更宽松的条件下从同一场景收集未对齐的图像对变得更加容易。

首先,本文探索了一种非对齐的监督设置,以使用清晰且非对齐的参考图像来训练去雾网络。其次,为了更有效地对模糊图像中存在的  进行建模,本文提出了均值和方差自注意力(mean and variance Self-Attention, mvSA)网络。通过结合暗通道先验(DCP)和模糊图像,mvSA 能够通过计算它们的平均值并预测由于波长和散射粒子的影响而引起的变化来突出模糊特征。此外,与DCP和自注意力机制相比,本文所提出的mvSA网络更准确地限制了全局大气光的范围。

去雾网络

去雾网络是将输入的有雾图像直接生成无雾图像。如图2所示,我们使用DCP方法计算出一个粗糙的无雾图像,然后将其放入去雾网络。它的架构是一个共享的生成器网络。有关详细信息,请参阅CycleGAN的生成器。

传输网络

传输网络是通过使用图2中的输入模糊图像的通道注意网络来生成三通道传输图。其体系结构是编码器-解码器结构,具有跨特征尺度的跳跃连接。最终的传输图可以通过引导滤波器获得。

损失函数

整体的损失函数如下:

此处, 和  分别为对应的多尺度参考损失(multi-scale reference loss)和重建损失(reconstruction loss)。

其中,多尺度参考损失主要结合了对抗损失和上下文损失,充分利用多尺度上下文信息来更好的优化去雾网络。另一方面,重建损失不仅可以监督全局大气光、传输和去雾网络的训练,还可以保持去雾结果的特征独立于未对齐的参考图像。

实验

Phone-hazy dataset

Non-aligned image pairs in real-world scenes

Compare with the latest SOTA methods

qualitative resultsquantitative results

More visualization results of NSDNet

总结

本文使用非对齐监督的真实世界图像提出了一种新颖有效的去雾框架。该框架利用多尺度参考损失将去雾网络的预测与清晰且未对齐的参考图像进行比较。它可以从现实环境中收集模糊/清晰的图像对,即使它们没有完全对齐。此外,所提框架包括一个均值和方差自注意力网络,该网络在改进空气光均值和变化的估计之前使用暗通道。最终,实验结果表明,所提方法对真实世界图像进行去雾方面优于最先进的方法。

相关实践学习
基于ECS和NAS搭建个人网盘
本场景主要介绍如何基于ECS和NAS快速搭建个人网盘。
阿里云文件存储 NAS 使用教程
阿里云文件存储(Network Attached Storage,简称NAS)是面向阿里云ECS实例、HPC和Docker的文件存储服务,提供标准的文件访问协议,用户无需对现有应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布式文件系统。 产品详情:https://www.aliyun.com/product/nas
CVHub
+关注
目录
打赏
0
0
0
0
9
分享
相关文章
基于AES的遥感图像加密算法matlab仿真
本程序基于MATLAB 2022a实现,采用AES算法对遥感图像进行加密与解密。主要步骤包括:将彩色图像灰度化并重置大小为256×256像素,通过AES的字节替换、行移位、列混合及轮密钥加等操作完成加密,随后进行解密并验证图像质量(如PSNR值)。实验结果展示了原图、加密图和解密图,分析了图像直方图、相关性及熵的变化,确保加密安全性与解密后图像质量。该方法适用于保护遥感图像中的敏感信息,在军事、环境监测等领域具有重要应用价值。
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
基于信息论的高动态范围图像评价算法matlab仿真
本项目基于信息论开发了一种高动态范围(HDR)图像评价算法,并通过MATLAB 2022A进行仿真。该算法利用自然图像的概率模型,研究图像熵与成像动态范围的关系,提出了理想成像动态范围的计算公式。核心程序实现了图像裁剪处理、熵计算等功能,展示了图像熵与动态范围之间的关系。测试结果显示,在[μ-3σ, μ+3σ]区间内图像熵趋于稳定,表明系统动态范围足以对景物成像。此外,还探讨了HDR图像亮度和对比度对图像质量的影响,为HDR图像评价提供了理论基础。
基于Affine-Sift算法的图像配准matlab仿真
本项目展示了Affine-SIFT算法的运行效果(无水印),适用于图像配准任务,能够处理旋转、缩放、平移及仿射变换。程序基于MATLAB2022A开发,包含完整代码与操作视频。核心步骤为:先用SIFT提取特征点,再通过仿射变换实现高精度对准。
基于FPGA的图像双线性插值算法verilog实现,包括tb测试文件和MATLAB辅助验证
本项目展示了256×256图像通过双线性插值放大至512×512的效果,无水印展示。使用Matlab 2022a和Vivado 2019.2开发,提供完整代码及详细中文注释、操作视频。核心程序实现图像缩放,并在Matlab中验证效果。双线性插值算法通过FPGA高效实现图像缩放,确保质量。
基于Retinex算法的图像去雾matlab仿真
本项目展示了基于Retinex算法的图像去雾技术。完整程序运行效果无水印,使用Matlab2022a开发。核心代码包含详细中文注释和操作步骤视频。Retinex理论由Edwin Land提出,旨在分离图像的光照和反射分量,增强图像对比度、颜色和细节,尤其在雾天条件下表现优异,有效解决图像去雾问题。
2025年全面的.NET跨平台应用框架推荐
2025年全面的.NET跨平台应用框架推荐
154 23
一款基于 .NET MVC 框架开发、功能全面的MES系统
一款基于 .NET MVC 框架开发、功能全面的MES系统
113 5
NET任务调度框架Hangfire使用指南
Hangfire 是一个用于 .NET 应用程序的开源任务调度框架,支持长时间运行任务、定时任务等。通过简单的安装配置,即可将任务从主线程分离,提升应用性能。支持多种数据库,提供丰富的任务类型如立即执行、延迟执行和周期性任务,并有可视化管理界面 Hangfire Dashboard。还支持安全性配置及扩展插件,如 Hangfire.HttpJob,适合各种复杂场景下的任务调度需求。
205 1
NET任务调度框架Hangfire使用指南
.NET开发技术在数字化时代的创新作用,从高效的开发环境、强大的性能表现、丰富的库和框架资源等方面揭示了其关键优势。
本文深入探讨了.NET开发技术在数字化时代的创新作用,从高效的开发环境、强大的性能表现、丰富的库和框架资源等方面揭示了其关键优势。通过企业级应用、Web应用及移动应用的创新案例,展示了.NET在各领域的广泛应用和巨大潜力。展望未来,.NET将与新兴技术深度融合,拓展跨平台开发,推动云原生应用发展,持续创新。
70 4
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等