带你读《2022技术人的百宝黑皮书》——大淘宝技术斩获NTIRE视频增强和超分比赛冠军(内含夺冠方案)(7) https://developer.aliyun.com/article/1243533?groupCode=taobaotech
如表3所示,第一阶段整体取得了0.326dB的PSNR增益。特别地,额外数据训练提高了0.083dB PSNR值,对该数据进行清洗可进一步提升0.043dB。渐进式训练方法将PSRN提高了0.128dB,同时增加了15.82M模型参数量。使用均方误差损失函数微调和删除重复帧预测分别带来0.028dB和0.014dB的PSNR收益。
表4展示了两个模型在线下验证集上每个视频的PSNR值,第二阶段将单模型PSNR提升了0.11dB,进行测试时集成(Test Time Asemble, TTA)后,PSNR提升了0.13dB,并在最终的线下测试集上达到了33.16dB的成绩,与基线方法BasicVSR++相比,整体提升了0.36dB。说明第二阶段可以提升视频恢复性能,也验证了两阶段方法在视频恢复任务中的有效性。
主观表现
图1展示了我们方法在NTIRE 2022挑战赛官方测试集上的增强效果,图4展示了我们方法在自选线下验证集上的增强效果。从图中可以看出,我们的方法可以对压缩视频中对模糊区域恢复出丰富的细节,此外能够减少压缩视频中的运动模糊,同时提高物体边缘的清晰度。
图4 线下验证集主观效果
消融实验
表7展示了第二阶段网络迁移学习的消融实验结果。相比从头开始训练的方法,使用迁移学习后,第二阶段网络的PSNR提升了0.04dB,说明将图像去噪知识迁移到压缩视频增强任务中可以取得较好的效果。此外采用迁移学习可以有效缩短训练时间,从66小时减少到29小时,验证了迁移学习训练的优势。
表7 第二阶段迁移学习消融实验
带你读《2022技术人的百宝黑皮书》——大淘宝技术斩获NTIRE视频增强和超分比赛冠军(内含夺冠方案)(9) https://developer.aliyun.com/article/1243530?groupCode=taobaotech