Python图片上采样工具 - RealESRGANer

本文涉及的产品
视觉智能开放平台,视频通用资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像通用资源包5000点
简介: Real-ESRGAN基于深度学习实现图像超分辨率放大,有效改善传统PIL缩放的模糊问题。支持多种模型版本,推荐使用魔搭社区提供的预训练模型,适用于将小图高质量放大至大图,放大倍率越低效果越佳。

基本介绍

代码: https://github.com/xinntao/Real-ESRGAN

小图片转换大图片,使用 PIL 的图片resize,图片会比较模糊。

这里就可以用深度学习的方案。

库依赖

解决库冲突需要一定的时间,这里记录下,关键库的版本:

numpy==1.26.4
torch==2.1.0
torchvision==0.16.0
realesrgan==0.3.0
basicsr==1.4.2

然后,就是模型,可以从:魔搭社区 下载。

下载地址: https://www.modelscope.cn/models/muse/RealESRGAN_x4plus/files

效果对比

依赖引入

import matplotlib.pyplot as plt
import numpy as np
from realesrgan import RealESRGANer
from basicsr.archs.rrdbnet_arch import RRDBNet
from PIL import Image

模型加载

# 加载模型
model = RRDBNet(
    num_in_ch=3,
    num_out_ch=3,
    num_feat=64,
    num_block=23,
    num_grow_ch=32,
    scale=4
)

model_path = "/root/dcgan/RealESRGAN_x4plus/RealESRGAN_x4plus.pth"
upsampler = RealESRGANer(
    scale=4,
    model_path=model_path,
    model=model,
    tile=0,
    tile_pad=10,
    pre_pad=0
)

upsampler

图片准备

base_path = "/root/dcgan/dcgan"
img1_64 = "8602_2004.jpg"
img2_64 = "31843_2010.jpg"
img1_32 = "5368_2003.jpg"
img2_32 = "764_2000.jpg"

img_lst = [img1_64, img2_64]

对比绘制

对比:64*64图片转换为:128*128图片的效果

# 绘图对比
def compare_list(img_lst, outscale=2):
    fig, axes = plt.subplots(len(img_lst), 3, figsize=(10, 3 * len(img_lst)))
    for index, value in enumerate(img_lst):
        # 路径
        file_full_name = f"{base_path}/images/{value}"
        # 原图
        img = Image.open(file_full_name)
        # resize图片
        img_resized = img.resize((128, 128), Image.Resampling.LANCZOS)
        # upsampler图片
        img_np = np.array(img.convert('RGB'))
        output, _ = upsampler.enhance(img_np, outscale=outscale)
        result_img = Image.fromarray(output)
        # 图片展示
        axes[index, 0].imshow(img)
        axes[index, 1].imshow(img_resized)
        axes[index, 2].imshow(result_img)
    plt.tight_layout(pad=0.1, h_pad=0.000001, w_pad=0.1)
    plt.show()

# 对比64*64效果
compare_list(img_lst)

image.png

对比:32 * 32 转换为 128 * 128的效果

compare_list([img1_32, img2_32], outscale=3)

image.png

对比结论

1、小图片放大,还是有些效果。

2、放大比例越小,效果越好。64 -> 128 效果明细好些。


相关文章
|
2天前
|
弹性计算 关系型数据库 微服务
基于 Docker 与 Kubernetes(K3s)的微服务:阿里云生产环境扩容实践
在微服务架构中,如何实现“稳定扩容”与“成本可控”是企业面临的核心挑战。本文结合 Python FastAPI 微服务实战,详解如何基于阿里云基础设施,利用 Docker 封装服务、K3s 实现容器编排,构建生产级微服务架构。内容涵盖容器构建、集群部署、自动扩缩容、可观测性等关键环节,适配阿里云资源特性与服务生态,助力企业打造低成本、高可靠、易扩展的微服务解决方案。
1078 0
|
11天前
|
人工智能 运维 安全
|
10天前
|
人工智能 测试技术 API
智能体(AI Agent)搭建全攻略:从概念到实践的终极指南
在人工智能浪潮中,智能体(AI Agent)正成为变革性技术。它们具备自主决策、环境感知、任务执行等能力,广泛应用于日常任务与商业流程。本文详解智能体概念、架构及七步搭建指南,助你打造专属智能体,迎接智能自动化新时代。
|
2天前
|
弹性计算 Kubernetes jenkins
如何在 ECS/EKS 集群中有效使用 Jenkins
本文探讨了如何将 Jenkins 与 AWS ECS 和 EKS 集群集成,以构建高效、灵活且具备自动扩缩容能力的 CI/CD 流水线,提升软件交付效率并优化资源成本。
265 0
|
9天前
|
人工智能 异构计算
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
B站开源IndexTTS2,用极致表现力颠覆听觉体验
在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推动零样本语音合成在实际场景中的落地能力,B站语音团队对模型架构与训练策略进行了深度优化,推出了全新一代语音合成模型——IndexTTS2 。
758 23
|
2天前
|
缓存 供应链 监控
VVIC seller_search 排行榜搜索接口深度分析及 Python 实现
VVIC搜款网seller_search接口提供服装批发市场的商品及商家排行榜数据,涵盖热销榜、销量排名、类目趋势等,支持多维度筛选与数据分析,助力选品决策、竞品分析与市场预测,为服装供应链提供有力数据支撑。
|
2天前
|
缓存 监控 API
Amazon item_review 商品评论接口深度分析及 Python 实现
亚马逊商品评论接口(item_review)可获取用户评分、评论内容及时间等数据,支持多维度筛选与分页调用,结合Python实现情感分析、关键词提取与可视化,助力竞品分析、产品优化与市场决策。

热门文章

最新文章