引言
在图像处理领域,AI技术正以前所未有的速度推动着图像修复与增强的发展。CodeFormer,一款由南洋理工大学与商汤科技联合开发的人脸复原模型,利用VQGAN和Transformer等前沿技术,为模糊或马赛克图像的修复提供了强大的解决方案。本文将引导你完成CodeFormer的安装配置,并演示其在照片修复和视频增强上的应用。
参考文献和Github地址:
Zhou, S., Zhu, Y., Wang, X., Wang, Z., & Zhang, J. (2022). CodeFormer: Towards Robust Blind Face Restoration with Codebook Lookup Transformer. arXiv preprint arXiv:2205.09991.
GitHub repository. (Accessed June 12, 2024).
安装与环境搭建
首先,确保你的系统已安装miniconda3
。创建一个Python 3.8的虚拟环境:
Bash
/home/sean.xd/miniconda3/bin/conda create -n codeformer python=3.8
接着,激活新创建的环境并安装venv
:
Bash
source activate codeformer /home/sean.xd/miniconda3/envs/codeformer/bin/python -m venv venv source venv/bin/activate
根据官方指南,安装项目依赖:
Bash
pip install -r requirements.txt
安装过程中可能会遇到缺少cython
的问题,手动安装后即可继续:
Bash
pip install cython python basicsr/setup.py develop
进一步安装dlib
和ffmpeg
:
Bash
/home/sean.xd/miniconda3/bin/conda install -c conda-forge dlib /home/sean.xd/miniconda3/bin/conda install -c conda-forge ffmpeg
下载预训练模型,准备测试:
Bash
python scripts/download_pretrained_models.py facelib python scripts/download_pretrained_models.py dlib python scripts/download_pretrained_models.py CodeFormer
测试视频增强功能
尝试使用CodeFormer
增强视频,但需注意,若PyTorch版本与CUDA不匹配,会导致警告信息提示。确保软件版本一致以获得最佳性能:
Bash
python inference_codeformer.py --bg_upsampler realesrgan --face_upsample -w 1.0 --input_path inputs/xudong.mp4
在测试过程中,观察到CPU使用率极高,表明模型在CPU上运行时计算量较大,对于长时间处理或大规模数据集,建议使用GPU加速。
测试图片增强功能
项目附带了一个测试目录,其中包含示例图片。运行增强命令:
Bash
python inference_codeformer.py -w 0.7 --bg_upsampler realesrgan --face_upsample --input_path inputs/whole_imgs/03.jpg
结果显示,即使在CPU上,CodeFormer
也能有效地检测并修复图像中的面部,最终结果保存在指定目录。
结语
通过上述步骤,我们不仅完成了CodeFormer
的安装配置,还体验了其在面部图像修复与增强方面的强大功能。尽管在CPU上运行效率较低,但在GPU环境下,CodeFormer
的表现将更加出色,为图像修复领域带来革命性的变化。
注:以上实验环境与测试均基于作者个人设置,具体效果可能因硬件配置差异而有所不同。
测试时候,使用了朱茵在大话西游里面的剧照,效果非常好,放上来审核不通过,所以就删掉了。