PRIDNet — Pyramid Real Image Denoising Network
这是用于盲降噪的最先进的深度学习架构。这种体系结构不像我们在前面的两个网络中看到的那样简单。PRIDNet有几个模块,分为三个主要部分。
起初看起来似乎有些不知所措。但是让我将其分解成细节,这很容易理解。
频道注意力模块
通道注意模块负责注意力机制。这里注意力机制的实现方式是将注意力放在输入U的每个通道上。可以将这种“注意力”视为权重。因此,每个通道将有一个权重。注意力权重将是大小为C [通道数]的向量。该向量将与输入U相乘。由于我们要“学习”注意力,因此我们需要该向量是可训练的。因此PRIDNet实施的过程是,首先对输入进行全局平均池化,然后从2个全连接层传递它,其结果应该是带有通道数的向量。这些是注意权重μ。
多尺度特征提取模块/金字塔模块
这是整个体系结构的核心。在这里,我们将使用给定内核大小的平均池化。这将对图像进行下采样。然后,我们将对其应用U-Net架构。我选择了5个级别的深层U-Net。最后,我们将以与平均池化相同的大小进行上采样。因此,这会将图像恢复为与输入(此模块的输入)相同的大小。
我们将使用不同的内核大小执行5次此操作,然后最后将结果连接起来。
内核选择模块
该模块的灵感来自介绍选择性内核网络的研究论文。该研究论文很好地阐述了该网络背后的思想,如下所示:
在标准的卷积神经网络(CNN)中,每一层中的人工神经元的感受野被设计为共享相同的大小。在神经科学界众所周知,视觉皮层神经元的感受野大小是受刺激调节的,在构建CNN时很少考虑。
设计了一个称为选择性内核(SK)单元的构建块,其中使用softmax注意融合了内核大小不同的多个分支,这些注意由这些分支中的信息指导。对这些分支的不同关注会导致融合层中神经元有效接受场的大小不同。
此模块与“通道注意力”模块非常相似。根据PRIDNet论文,大小为C的合成矢量α,β,γ分别表示对U’,U’和U’’的柔和注意。
整个PRIDNet架构图如下所示,
结果如下:
可以看到,与先前讨论的体系结构相比,该体系结构可提供最佳结果。在上面的眼睛特写图像中,请注意去噪图像中眼球的细节水平!
嘈杂图像中的黑色书籍[Cropped Library books]。它们几乎与周围的棕色家具没有区别。一切似乎都是黑色的。但是,我们的模型能够以至少可以区分书籍和周围家具的方式对其进行去噪。第二张图片[裁剪的图书馆家具]也是如此。在嘈杂的图像中,您可以看到家具非常黑,顶部似乎几乎是黑色的。但是,我们的模型能够理解棕色并对其进行去噪。这太神奇了!
该体系结构的PSNR得分为33.3105,SSIM得分为0.8534。
结果对比
我们可以清楚地看到PRIDNet是性能最佳的体系结构,用于消噪单个图像的时间最少。
现在,我们比较一下NLM滤波器和PRIDNet的结果。
要比较的关键领域
- 黄色卡车的车顶区域
- 橙色卡车的座位
- 蓝色卡车中的橙色大灯
- 蓝色卡车的车顶(观察阴影)
- 地板中间的两个细条纹
还有很多
未来的工作和改进范围
图像去噪是一个活跃的研究领域,并且时不时地有许多惊人的架构正在开发以对图像进行去噪。最近,研究人员正在使用GAN来对图像进行降噪,事实证明,这种方法会产生令人惊讶的结果。好的GAN架构肯定会进一步改善去噪效果。