InvSR:开源图像超分辨率生成模型,提升分辨率,修复老旧照片为超清图像

本文涉及的产品
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,分割抠图1万点
简介: InvSR 是一个创新的图像超分辨率模型,基于扩散模型的逆过程恢复高分辨率图像。它通过深度噪声预测器和灵活的采样机制,能够高效地提升图像分辨率,适用于老旧照片修复、视频监控、医疗成像等多个领域。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 功能:InvSR 通过扩散模型的逆过程恢复高分辨率图像,提升图像分辨率。
  2. 技术:基于扩散模型框架,利用深度噪声预测器和灵活的采样机制,支持任意数量的采样步骤。
  3. 应用:适用于老旧照片修复、视频监控、医疗成像等多个领域,提升图像清晰度。

正文(附运行示例)

InvSR 是什么

公众号: 蚝油菜花 - InvSR

InvSR 是一个创新的图像超分辨率模型,基于扩散模型的逆过程恢复高分辨率图像。它利用大型预训练扩散模型中的丰富图像先验知识,通过深度噪声预测器来估计正向扩散过程中所需的最优噪声图。这种方法不仅能够充分利用扩散模型的先验知识,还提供了灵活高效的采样机制,用户可以根据图像退化的类型或特定需求自由调整采样步骤。

InvSR 的核心在于其深度噪声预测器,该预测器能够估计出在正向扩散过程中所需的最优噪声图。通过这种方式,InvSR 能够在减少采样步骤的情况下,依然保持或超越现有方法的性能,实现计算效率的提升。

InvSR 的主要功能

  • 图像超分辨率提升:主要功能是提高图像的分辨率,从低分辨率图像恢复出高分辨率图像。
  • 灵活的采样机制:支持从一到五个任意数量的采样步骤,用户可以根据图像退化类型或特定需求调整采样步骤。
  • 噪声预测:深度噪声预测器估计最优噪声图,用于初始化扩散模型的采样过程。
  • 扩散模型利用:充分利用预训练的扩散模型中的图像先验知识,提高超分辨率的性能。
  • 高效计算:即使在减少采样步骤的情况下,也能保持或超越现有方法的性能,实现计算效率的提升。

InvSR 的技术原理

  • 扩散模型框架:基于扩散模型(如 DDPM),逐步添加噪声将高分辨率图像转化为低分辨率图像的随机噪声图。
  • 部分噪声预测策略:构建扩散模型的中间状态作为起始采样点,简化从低分辨率到高分辨率的反转过程。
  • 深度噪声预测器:核心组件之一,用于估计正向扩散过程中的最优噪声图,从而在扩散轨迹上部分初始化采样过程。
  • 逆向扩散过程:从噪声图开始,通过逆向扩散过程逐步去除噪声,恢复出高分辨率图像。
  • 灵活的采样步骤:选择不同的起始采样点,并结合现有的采样算法,实现不同数量的采样步骤,适应不同的图像退化情况。
  • 训练与优化:通过最小化预测高分辨率图像与真实高分辨率图像之间的差异来训练噪声预测器,使用 L2 损失、LPIPS 损失和 GAN 损失进行训练,优化性能。

如何运行 InvSR

快速测试

python inference_invsr.py -i [image folder/image path] -o [result folder] --num_steps 1
  1. 处理大图像:例如从 1k 分辨率提升到 4k,建议添加选项 --chopping_size 256
  2. 其他选项
    • 指定预下载的 SD Turbo 模型:--sd_path
    • 指定预下载的噪声预测器:--started_ckpt_path
    • 采样步骤数量:--num_steps
    • 如果 GPU 内存有限,请添加选项 --chopping_bs 1

在线 Demo

你可以通过以下命令尝试在线 Demo:

python app.py

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
7月前
|
编解码 人工智能 测试技术
无需训练,这个新方法实现了生成图像尺寸、分辨率自由
【4月更文挑战第25天】研究人员提出FouriScale方法,解决了扩散模型在生成高分辨率图像时的结构失真问题。通过膨胀卷积和低通滤波,该方法实现不同分辨率下图像的结构和尺度一致性,无需重新训练模型。实验显示FouriScale在保持图像真实性和完整性的同时,能生成任意尺寸的高质量图像,尤其在处理高宽比图像时表现出色。尽管在极高分辨率生成上仍有局限,但为超高清图像合成技术提供了新思路。[链接: https://arxiv.org/abs/2403.12963]
82 5
|
7月前
|
存储 传感器 数据安全/隐私保护
CVPR 2024 Highlight:基于单曝光压缩成像,不依赖生成模型也能从单张图像中重建三维场景
【5月更文挑战第15天】CVPR 2024会议上,清华大学研究人员提出的SCINeRF利用单曝光压缩成像(SCI)技术结合神经辐射场(NeRF)进行3D场景重建。SCI以低成本捕捉高维数据,而SCINeRF将SCI的成像过程融入NeRF训练,实现复杂场景的高效重建。实验显示,该方法在图像重建和多视角图像生成方面取得优越性能,但实际应用仍需解决SCI系统设计、训练效率和模型泛化等挑战。[Link: https://arxiv.org/abs/2403.20018]
175 2
|
7月前
|
机器学习/深度学习 人工智能 达摩院
DDColor:AI图像着色工具,优秀的黑白图像上色模型,支持双解码器!
DDColor:AI图像着色工具,优秀的黑白图像上色模型,支持双解码器!
399 3
|
人工智能 开发者
老照片修复:划痕修复+黑白照片上色+面部以及画质的增强
简介: 历久弥新:用AI修复亚运会珍贵史料
626 1
老照片修复:划痕修复+黑白照片上色+面部以及画质的增强
|
编解码 人工智能 移动开发
AIGC图像分辨率太低?快来试试像素感知扩散超分模型,你想要的细节都在这里
阿里巴巴最新自研的像素感知扩散超分模型已经开源,它把扩散模型强大的生成能力和像素级控制能力相结合,能够适应从老照片修复到AIGC图像超分的各种图像增强任务和各种图像风格,并且能够控制生成强度和增强风格。这项技术的直接应用之一是AIGC图像的后处理增强和二次生成,能够带来可观的效果提升。
893 4
|
人工智能
老照片修复:黑白照片上色+面部以及画质的增强
历久弥新:用AI修复亚运会珍贵史料
208 1
|
机器学习/深度学习 编解码 定位技术
风格迁移 图像合成 图像重构 更换姿态和图像背景(使用交叉注意控制进行提示到图像编辑)GAN网络增强版
风格迁移 图像合成 图像重构 更换姿态和图像背景(使用交叉注意控制进行提示到图像编辑)GAN网络增强版
|
数据采集 机器学习/深度学习 编解码
图像超分实验:SRCNN/FSRCNN
【摘要】 图像超分即超分辨率,将图像从模糊的状态变清晰。本文对BSDS500数据集进行超分实验。
497 1
图像超分实验:SRCNN/FSRCNN
|
人工智能 自动驾驶 图形学
英伟达开发最快 NeRf 技术:数秒内将 2D 照片合成为 3D 场景
英伟达开发最快 NeRf 技术:数秒内将 2D 照片合成为 3D 场景
271 0
|
人工智能 算法 数据可视化
国防科技大学提出ROSEFusion,实现快速相机移动下的高精度在线RGB-D重建
近日,国防科技大学徐凯教授团队提出了基于随机优化求解快速移动下的在线 RGB-D 重建方法 ROSEFusion,在无额外硬件辅助的条件下,仅依靠深度信息,实现了最高 4 m/s 线速度、6 rad/s 角速度相机移动下的高精度在线三维重建。
301 0
国防科技大学提出ROSEFusion,实现快速相机移动下的高精度在线RGB-D重建

热门文章

最新文章