CVPR 2021 | 性能炸裂!MPRNet:多阶段渐进式图像恢复

简介: 在本文中,我们提出了一种新颖的协同设计,可以最佳地平衡这些相互竞争的目标。我们的主要建议是一个多阶段体系结构,该体系结构逐步学习降级输入的恢复特征,从而将整个恢复过程分解为更易于管理的步骤。

太强了!在图像去雨、去模糊、去噪等任务上拿下多项SOTA!性能优于MSPFN、PreNet等网络,代码于5个小时前开源!


640.png


看看MPRNet在各大数据集刷榜的存在!


640.png


640.png

作者单位:IIAI, MBZUAI, 谷歌等

代码:https://github.com/swz30/MPRNet

论文:https://arxiv.org/pdf/2102.02808.pdf


图像恢复任务要求在恢复图像时在空间细节和高级上下文信息之间达成复杂的平衡。


在本文中,我们提出了一种新颖的协同设计,可以最佳地平衡这些相互竞争的目标。我们的主要建议是一个多阶段体系结构,该体系结构逐步学习降级输入的恢复特征,从而将整个恢复过程分解为更易于管理的步骤。


具体来说,我们的模型首先使用编码器-解码器体系结构学习上下文相关的特征,然后将它们与保留局部信息的高分辨率分支相结合。


640.png


图3:(a)编码器-解码器子网。(b)图示我们的ORSNet子网中的原始分辨率块(ORB),每个ORB包含多个通道注意块,GAP代表全球平均池[47]。(c)阶段1和阶段2之间的跨阶段特征融合。(d)阶段2和最后阶段之间的CSFF


在每个阶段,我们都会介绍一种新颖的每像素自适应设计,该设计利用in-situ监督的注意力来重新加权局部特征。这种多阶段体系结构的关键要素是不同阶段之间的信息交换。


640.png

图4:监督注意模型


为此,我们提出了一种两方面的方法,即不仅从早期到后期顺序交换信息,而且在特征处理模块之间也存在横向连接,以避免信息丢失。由此产生的紧密互连的多级体系结构称为MPRNet,可在包括图像去雨,去模糊和去噪在内的一系列任务的十个数据集上获得强劲的性能提升。


640.png


图2:提议的渐进式图像恢复的多阶段体系结构。较早的阶段使用编码器/解码器来提取多尺度上下文相关的特征,而最后阶段则以原始图像分辨率运行以生成空间精确的输出。在每两个阶段之间添加一个监督注意力模块,该模块学习在将一个阶段的特征传递到下一阶段之前对其进行细化。虚线的粉红色箭头表示跨阶段特征融合机制。


主要贡献


这项工作的主要贡献是:


  • 一种新颖的多阶段方法,能够生成内容丰富且空间精确的输出。由于其多阶段的性质,我们的框架将具有挑战性的图像还原任务分解为子任务,以逐步还原退化的图像。


  • 一个有效的监督注意力模块,该模块在进一步传播传入特征之前,会在每个阶段充分利用还原的图像来完善传入特征。


  • 跨阶段聚合多尺度特征的策略。


  • 我们通过在十个合成的和真实的数据集上设置最先进的最新数据集来证明MPRNet的有效性,这些数据集可用于各种恢复任务,包括图像去油,去模糊和去噪,同时保持较低的复杂度(见图1)。此外,我们提供了详细的烧蚀,定性结果和泛化测试。


Quick Run


要在您自己的图像上测试去模糊、去油、去噪的预训练模型,请运行


python demo.py --task Task_Name --input_dir path_to_images --result_dir save_images_here


这是执行去模糊的示例:


python demo.py --task Deblurring --input_dir ./samples/input/ --result_dir ./samples/output/


实验结果


例如,与最新技术相比,在Rain100L,GoPro和DND数据集上,我们分别获得4 dB,0.81 dB和0.21 dB的PSNR增益。


去雨的性能结果


640.png

640.png


去模糊的性能结果

640.png


表3:去模糊结果。我们的方法仅在GoPro数据集[51]上训练,并直接应用于HIDE数据集[67]。


640.png


表4:在两种不同的设置下对RealBlur数据集进行去模糊比较:1) 将我们经过GoPro训练的模型直接应用于RealBlur集(以评估对真实图像的泛化),2) 对RealBlur数据的培训和测试,其中方法用符号‡表示。其他评估方法的PSNR / SSIM分数取自RealBlur基准测试[62]。


640.png


去噪的性能结果


640.png


表5:不在SIDD [1]和DND [58]数据集上进行去噪比较。∗表示使用其他训练数据的方法。而我们的MPRNet仅在SIDD图像上进行训练,而在DND上直接进行测试。


640.png


图7:图像降噪比较。第一个示例来自DND [58],其他示例来自SIDD [1]。提出的MPRNet可以更好地保留去噪图像中的精细纹理和结构图案.

相关文章
|
6月前
|
机器学习/深度学习 传感器 自动驾驶
狂风暴雨依旧YOLO | 全新数据集,全新任务,促进极端降雨条件下目标检测的优化和发展
狂风暴雨依旧YOLO | 全新数据集,全新任务,促进极端降雨条件下目标检测的优化和发展
241 0
|
23天前
|
数据采集 机器人 计算机视觉
一手训练,多手应用:国防科大提出灵巧手抓取策略迁移新方案
【10月更文挑战第24天】国防科技大学研究人员提出了一种新颖的机器人抓取方法,通过学习统一的策略模型,实现不同灵巧夹具之间的策略迁移。该方法分为两个阶段:与夹具无关的策略模型预测关键点位移,与夹具相关的适配模型将位移转换为关节调整。实验结果显示,该方法在抓取成功率、稳定性和速度方面显著优于基线方法。论文地址:https://arxiv.org/abs/2404.09150
28 1
|
1月前
|
人工智能 人机交互 智能硬件
从大模型的原理到提示词优化
本文介绍了大语言模型(LLM)的基本概念及其工作原理,重点探讨了AI提示词(Prompt)的重要性和几种有效技巧,包括角色设定、One-shot/Few-shot、任务拆解和思维链。通过实例解析,展示了如何利用这些技巧提升LLM的输出质量和准确性,强调了提供高质量上下文信息对优化LLM表现的关键作用。
47 0
|
2月前
|
编解码 人工智能 测试技术
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治切分增大分辨率后遗症
【9月更文挑战第7天】华中科技大学与华南理工大学联合发布了一款名为Mini-Monkey的2B参数多模态大语言模型,采用多尺度自适应裁剪策略(MSAC)和尺度压缩机制(SCM),在高分辨率图像处理方面取得突破,尤其在文档理解上超越了8B参数的SOTA模型InternVL2-8B。Mini-Monkey仅需8张RTX 3090显卡即可完成训练,展现出高效性能,但处理复杂图像场景时仍存局限。论文详情见:https://arxiv.org/pdf/2408.02034。
45 8
|
3月前
|
机器学习/深度学习 并行计算 索引
Sora视频重建与创新路线问题之Mask并行解码提升效率,如何解决
Sora视频重建与创新路线问题之Mask并行解码提升效率,如何解决
|
3月前
|
机器学习/深度学习 编解码
Sora视频重建与创新路线问题之模型以处理更长的视频并保持时间一致性如何优化
Sora视频重建与创新路线问题之模型以处理更长的视频并保持时间一致性如何优化
|
6月前
|
机器学习/深度学习 自然语言处理
YOLOv5改进 | 2023 | CARAFE提高精度的上采样方法(助力细节长点)
YOLOv5改进 | 2023 | CARAFE提高精度的上采样方法(助力细节长点)
347 2
|
6月前
|
机器学习/深度学习 编解码 自然语言处理
YOLOv8改进 | 2023 | CARAFE提高精度的上采样方法(助力细节长点)
YOLOv8改进 | 2023 | CARAFE提高精度的上采样方法(助力细节长点)
442 2
|
6月前
|
机器学习/深度学习 编解码 计算机视觉
|
机器学习/深度学习 传感器 算法
【图像重建】在线全息图的迭代双图像自由重建附matlab代码
【图像重建】在线全息图的迭代双图像自由重建附matlab代码