极智AI | AI算法修复上世纪老照片 还你祖辈记忆

本文涉及的产品
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
简介: 大家好,我是极智视界,本文介绍一下 用 AI 算法修复模糊老照片的方法。

大家好,我是极智视界,本文介绍一下 用 AI 算法修复模糊老照片的方法。

唐、宋、元、明、清,清朝 (1636 年 ~1912 年) 是中国历史上最后一个封建王朝,共传十二帝。统治者为 爱新觉罗氏。从努尔哈赤建立后金起,总计 296 年;从皇太极改国号为清起,国祚 276 年。清,在你的记忆中是不是这样的:

清朝在我们的记忆中已经很遥远了,远到似乎只能从 遗址考古鉴宝 才能唤起一些场面。但现实 2022 - 1912 距今也才 110 年而已。这很容易引发思考,人活着 百年后又留下了什么呢。喜欢研究历史、研究天文的人们一定了解,人类如此渺小而短暂,故如何利用好有限的一生,特别重要。

1931 年 918 事变是抗日战争的开始,那是一段不堪回首的记忆,同胞们受尽了折磨、凌辱,但中华好儿女生来倔强,于 1945 年取得抗战的完全胜利,这段红色记忆可能是这样的:

我们再来算一下 2022 - 1945 = 77 年,也才 77年,不得不感叹 改革开放一国两制 给新中国带来的的发展势头,现在的和平与美好生活真的来之不易。

现代生活,科技真的让生活越来越美丽。性能越来越好的手机、清晰度越来越高的相机 还有各种丰富的传感器 sensor,把我们生活的点点滴滴 清晰 的记录下来。清晰画面、清晰视屏、清晰语音的背后支撑,是 sensor 硬件的不断先进,是图像处理算法的不断升级。随着 AI 算法的不断进步,现在我们完全可以用 AI 算法来修复我们“模糊的记忆” 了,而且效果还挺不错。大家可能听过 清朝的黑白录像彩色化静态的人像眼睛一眨一眨笑起来了,这些都是 AI 的能力。

GAN 网络是一个很好玩的算法,可以做很多有趣的事情,比如:生成风格不一样的人像、人像动漫化、给你换个发型、性别互换后你会长啥样、要是你是印度人你会长啥样 等等,当然也包括咱们这里的 人像去模糊

这里我们用到了 GAN 算法,如果想要工程源码,可以点击 这里 自取。整个网络的架构如下:

该网络主要由两个模块组成:

  • (1) 去退化模块:为一个 Unet;
  • (2) 先验的预训练 GAN 模块:为一个 StyleGAN2;

两个模块通过基于通道分割的空间特征转换 (CS-SFT) 方式连接,去退化模块将潜在特征映射至预训练的 StyleGAN2 的潜在特征空间,多分辨率特征从粗到细地调制 StyleGAN2,损失函数除了传统的对抗损失之外,还添加了面部组件损失、身份保真损失、去退化模块重建损失。

在我们拿到工程后先进行依赖环境的安装:

# Install basicsr - https://github.com/xinntao/BasicSR
# use BasicSR for both training and inference
pip install basicsr
# Install facexlib - https://github.com/xinntao/facexlib
# use face detection and face restoration helper in the facexlib package
pip install facexlib
pip install -r requirements.txt
python setup.py develop
# If you want to enhance the background (non-face) regions with Real-ESRGAN,
# you also need to install the realesrgan package
pip install realesrgan

接着可以按 README.md 里去下载预训练权重,也可以直接如下命令:

wget https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth -P experiments/pretrained_models

然后可以进行推理验证:

python inference_gfpgan.py -i inputs/whole_imgs -o results -v 1.3 -s 2

其中一些传参的解释如下:

Usage: python inference_gfpgan.py -i inputs/whole_imgs -o results -v 1.3 -s 2 [options]...
  -h                   show this help
  -i input             Input image or folder. Default: inputs/whole_imgs
  -o output            Output folder. Default: results
  -v version           GFPGAN model version. Option: 1 | 1.2 | 1.3. Default: 1.3
  -s upscale           The final upsampling scale of the image. Default: 2
  -bg_upsampler        background upsampler. Default: realesrgan
  -bg_tile             Tile size for background sampler, 0 for no tile during testing. Default: 400
  -suffix              Suffix of the restored faces
  -only_center_face    Only restore the center face
  -aligned             Input are aligned faces
  -ext                 Image extension. Options: auto | jpg | png, auto means using the same extension as inputs. Default: auto

咱们用一些图片进行效果的展示:

可以看到 人像去模糊 效果还是很不错的。

这个时候,你是不是应该动动你的小手,拿出老照片,实践一下,看看效果呢~


好了,以上分享了 讲解 AI 算法修复老照片的方法,希望我的分享能对你的学习有一点帮助。


logo_show.gif

相关文章
|
4月前
|
传感器 人工智能 监控
智慧工地 AI 算法方案
智慧工地AI算法方案通过集成多种AI算法,实现对工地现场的全方位安全监控、精准质量检测和智能进度管理。该方案涵盖平台层、展现层与应用层、基础层,利用AI技术提升工地管理的效率和安全性,减少人工巡检成本,提高施工质量和进度管理的准确性。方案具备算法精准高效、系统集成度高、可扩展性强和成本效益显著等优势,适用于人员安全管理、施工质量监控和施工进度管理等多个场景。
148 0
|
16天前
|
人工智能 编解码 算法
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
本文介绍了通义灵码2.0 AI程序员在嵌入式开发中的实战应用。通过安装VS Code插件并登录阿里云账号,用户可切换至DeepSeek V3模型,利用其强大的代码生成能力。实战案例中,AI程序员根据自然语言描述快速生成了C语言的base64编解码算法,包括源代码、头文件、测试代码和CMake编译脚本。即使在编译错误和需求迭代的情况下,AI程序员也能迅速分析问题并修复代码,最终成功实现功能。作者认为,通义灵码2.0显著提升了开发效率,打破了编程语言限制,是AI编程从辅助工具向工程级协同开发转变的重要标志,值得开发者广泛使用。
7887 68
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
|
9天前
|
人工智能 编解码
For Her:阿里云携手国际奥委会推出AI修复影片《永不失色的她》
For Her:阿里云携手国际奥委会推出AI修复影片《永不失色的她》
|
20天前
|
人工智能 算法
细思极恐,GPT-4竟串谋AI欺骗人类!哈佛PSU重磅揭秘算法共谋,AI教父预言正成真
近日,哈佛大学和宾夕大合著的重磅论文揭示,基于大型语言模型(如GPT-4)的算法可能自主串谋,损害消费者利益。研究发现,这些算法在虚拟市场中能迅速达成默契,提高价格以获取更高利润,类似于人类垄断行为。这一现象曾被DeepMind联合创始人Shane Legg预言,如今成为现实。论文呼吁加强对AI的监管,确保其透明性和可解释性,以防止潜在风险,并促进AI的可持续发展。
27 6
|
2月前
|
人工智能
RealisHuman:AI 生成的人像不真实?后处理框架帮你修复生成图像中畸形人体部位
RealisHuman 是一个创新的后处理框架,专注于修复生成图像中畸形的人体部位,如手和脸,通过两阶段方法提升图像的真实性。
107 11
RealisHuman:AI 生成的人像不真实?后处理框架帮你修复生成图像中畸形人体部位
|
13天前
|
存储 人工智能 搜索推荐
Memobase:开源AI长期记忆系统,让AI真正记住每个用户的秘密武器
Memobase 是一个开源的长期记忆系统,专为生成式 AI 应用设计,通过用户画像和时间感知记忆功能,帮助 AI 记住、理解并适应用户需求。
90 0
|
13天前
|
机器学习/深度学习 自然语言处理 算法
生成式 AI 大语言模型(LLMs)核心算法及源码解析:预训练篇
生成式 AI 大语言模型(LLMs)核心算法及源码解析:预训练篇
113 0
|
2月前
|
机器学习/深度学习 人工智能 算法
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题
《PatternBoost: Constructions in Mathematics with a Little Help from AI》提出了一种结合传统搜索算法和Transformer神经网络的PatternBoost算法,通过局部搜索和全局优化交替进行,成功应用于组合数学问题。该算法在图论中的Ramsey数研究中找到了更小的反例,推翻了一个30年的猜想,展示了AI在数学研究中的巨大潜力,但也面临可解释性和通用性的挑战。论文地址:https://arxiv.org/abs/2411.00566
97 13
|
3月前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
882 10
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
|
3月前
|
机器学习/深度学习 人工智能 算法
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
Enhance-A-Video 是由上海人工智能实验室、新加坡国立大学和德克萨斯大学奥斯汀分校联合推出的视频生成质量增强算法,能够显著提升视频的对比度、清晰度和细节真实性。
146 8
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现

热门文章

最新文章