AI 黑科技,老照片修复,模糊变高清

简介: AI 黑科技,老照片修复,模糊变高清

兄弟们好


最近闲逛,发现腾讯开源的老照片修复算法FPGAN新出了V1.3预训练模型,手痒试了一下,满惊艳的。


我拿“自己”的旧照片试了一下,先看效果

640.png

对比:右侧为修复后


640.png


只看人脸部分


GFPGAN


640.png

https://arxiv.org/pdf/2101.04061.pdf


FPGAN算法由腾讯PCG ARC实验室提出,其相关论文已被CVPR2021收录。


研究核心利用了包含在训练好的人脸生成模型里的「知识」, 被称之为生成人脸先验 (Generative Facial Prior, GFP)。它不仅包含了丰富的五官细节, 还有人脸颜色, 此外它能够把人脸当作一个整体来对待, 能够处理头发、耳朵、面部轮廓。基于预训练好的生成模型, 研究者们提出了利用生成人脸先验 GFP 的人脸复原模型 GFP-GAN。相比于近几年其他人脸复原的工作, GFP-GAN 不仅在五官恢复上取得了更好的细节, 整体也更加自然, 同时也能够对颜色有一定的增强作用。


640.png

GFP-GAN 框架概览图


Online 试玩版


官方提供了 Online 试玩版


Huggingface (只返回人脸)


https://huggingface.co/spaces/akhaliq/GFPGAN

Replicate.ai

https://replicate.com/xinntao/gfpgan

Baseten.co

https://app.baseten.co/applications/Q04Lz0d/operator_views/8qZG6Bg

我测试了一下,只有Replicate比较稳定。


只需将你想修复的照片拖进左边的图片框内,点击Submit即可。

640.png

比如我把自己的照片再传上去


640.png

效果不太理想,锐化有点过,貌似是因为用的V1.2的预训练模型吧。


本地运行


本地运行可以使用最新的预训练模型,修复效果更加自然,能在低质量输入的情况下,输出高质量结果。


环境要求:


Python >= 3.7 (推荐使用Anaconda or Miniconda)

PyTorch >= 1.7

Option: NVIDIA GPU + CUDA

Option: Linux

我的系统是Ubuntu 20.04.2 LTS ,Win平台没有尝试,感兴趣的同学可以试试。


克隆项目


git clone https://github.com/TencentARC/GFPGAN.git
cd GFPGAN


安装依赖


# 安装BasicSR:基于 PyTorch 的开源图像视频复原工具箱, 比如 超分辨率, 去噪, 去模糊, 去 JPEG 压缩噪声等.
pip install basicsr
# 安装facexlib: 提供实用的人脸相关功能的集合
pip install facexlib
# 安装GFPGAN依赖包
pip install -r requirements.txt
python setup.py develop
# Real-ESRGAN:图像分辨率修复工具,可以提升照片分辨率
pip install realesrgan


注:


直接pip install basicsr,我遇到大面积的warning,后面运行时报错了


ImportError: cannot import name 'load_file_from_url' from 'basicsr.utils.download_util'


大家如果有相同问题,可以尝试


!pip install basicsr


下载V1.3预训练模型


# 
wget https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth -P experiments/pretrained_models


模型就下载到experiments/pretrained_models目录下了

640.png


运行


终端切到GFPGAN目录下,运行:


python inference_gfpgan.py -i inputs/whole_imgs -o results -s 2


inputs目录下存放准备修复的图片,工程包里包含了部分测试图片,你也可以将自己要修复的图片放在inputs下一级的某个文件夹中。


results目录则保存处理后生成的结果图片,包含了对比图像、人脸图像、整张图像等多个子文件夹。


第一次运行时会比较慢,还会额外自动下载facexlib的模型文件;稍后片刻就能在results\cmp目录下看到修复前后的对比图片了:


640.png

640.png

相关文章
|
7月前
|
人工智能 并行计算 Linux
斯坦福黑科技让笔记本GPU也能玩转AI视频生成!FramePack:压缩输入帧上下文长度!仅需6GB显存即可生成高清动画
斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度,解决视频生成中的"遗忘"和"漂移"问题,仅需6GB显存即可在普通笔记本上实时生成高清视频。
1656 19
斯坦福黑科技让笔记本GPU也能玩转AI视频生成!FramePack:压缩输入帧上下文长度!仅需6GB显存即可生成高清动画
|
7月前
|
人工智能 编解码 自然语言处理
DreamActor-M1:字节跳动推出AI动画黑科技,静态照片秒变生动视频
DreamActor-M1是字节跳动研发的AI图像动画框架,通过混合引导机制实现高保真人物动画生成,支持多语言语音驱动和形状自适应功能。
710 40
DreamActor-M1:字节跳动推出AI动画黑科技,静态照片秒变生动视频
|
4月前
|
人工智能 安全 JavaScript
革新低代码开发!VTJ.PRO v0.12.58 发布:首推「AI代码校验修复引擎」,破解生成式代码质量隐患
VTJ.PRO发布v0.12.58版本,推出「AI-CodeFix」智能引擎,实现AI生成代码的自动校验、诊断与修复,解决低代码开发调试难题。通过动态语义扫描、智能修复策略和开发者体验升级,大幅降低错误率,提升开发效率与代码质量,助力企业实现安全可控的AI开发。
183 0
|
7月前
|
机器学习/深度学习 人工智能 编解码
EasyControl Ghibli:在线体验一键生成宫崎骏动画风,开源AI模型让你的照片秒变吉卜力
EasyControl Ghibli是基于扩散模型的AI工具,通过条件注入技术将普通照片转化为吉卜力动画风格,仅需100张训练样本即可精准还原标志性光影与色调特征。
1074 11
EasyControl Ghibli:在线体验一键生成宫崎骏动画风,开源AI模型让你的照片秒变吉卜力
|
9月前
|
存储 人工智能 编解码
Pippo:Meta放出AI大招!单张照片秒转3D人像多视角视频,AI自动补全身体细节
Pippo 是 Meta 推出的图像到视频生成模型,能够从单张照片生成 1K 分辨率的多视角高清人像视频,支持全身、面部或头部的生成。
756 9
Pippo:Meta放出AI大招!单张照片秒转3D人像多视角视频,AI自动补全身体细节
|
8月前
|
存储 人工智能 Docker
Heygem:开源数字人克隆神器!1秒视频生成4K超高清AI形象,1080Ti显卡也能轻松跑
Heygem 是硅基智能推出的开源数字人模型,支持快速克隆形象和声音,30秒内完成克隆,60秒内生成4K超高清视频,适用于内容创作、直播、教育等场景。
3506 8
|
8月前
|
人工智能 编解码
For Her:阿里云携手国际奥委会推出AI修复影片《永不失色的她》
For Her:阿里云携手国际奥委会推出AI修复影片《永不失色的她》
316 4
|
10月前
|
人工智能
RealisHuman:AI 生成的人像不真实?后处理框架帮你修复生成图像中畸形人体部位
RealisHuman 是一个创新的后处理框架,专注于修复生成图像中畸形的人体部位,如手和脸,通过两阶段方法提升图像的真实性。
426 11
RealisHuman:AI 生成的人像不真实?后处理框架帮你修复生成图像中畸形人体部位
|
11月前
|
编解码 人工智能 监控
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
VISION XL是一款基于潜在扩散模型的高效视频修复和超分辨率工具,能够修复视频缺失部分、去除模糊,并支持四倍超分辨率。该工具优化了处理效率,适合快速处理视频的应用场景。
2774 6
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
|
人工智能 自然语言处理 IDE
CodeFuse IDE 0.6 版本发布,支持编辑器诊断问题 AI 修复
CodeFuse IDE 是基于蚂蚁自研大模型和 OpenSumi 框架的 AI 编程助手,支持多语言,提供代码建议、解释、测试生成等,增强开发效率。最新版增加 AI 修复和智能补全功能,开源并支持 VS Code 插件生态。[了解更多](https://github.com/codefuse-ai/codefuse-ide)
601 0

热门文章

最新文章