Python实现图像完美超分处理 | Python工具

简介: Python实现图像完美超分处理 | Python工具

前言

根据上一篇文章:图片、视频超分模型RealBasicVSR安装使用 | 机器学习_剑客阿良_ALiang的博客-CSDN博客


我把项目进行的工具化调整,做成了对单一照片输入进行处理的工具。大家可以拿去直接集成到代码中使用。


github项目地址:工具项目地址


项目说明

项目结构如下


image.png


注意项


1、 checkpoints中的模型文件太大,上传不到github上,大家可以通过下面我分享的百度云盘地址下载,放到checkpoints目录中。


链接:https://pan.baidu.com/s/1EFCk5SUsE9BTPR5rlVnKtw

提取码:TUAN


2、conda环境安装,我这里就不多叙述了,直接参考上一篇文章中的安装过程即可。


图片、视频超分模型RealBasicVSR安装使用 | 机器学习_剑客阿良_ALiang的博客-CSDN博客


代码说明

主要的核心代码是inference_hy.py文件,代码如下:

#!/user/bin/env python
# coding=utf-8
"""
@project : hy_realbasicvsr
@author  : 剑客阿良_ALiang
@file   : inference_hy.py
@ide    : PyCharm
@time   : 2022-05-08 15:18:15
"""
import argparse
import glob
import os
import cv2
import mmcv
import numpy as np
import torch
import uuid
from mmcv.runner import load_checkpoint
from mmedit.core import tensor2img
from realbasicvsr.models.builder import build_model
def init_model(config, checkpoint=None):
    if isinstance(config, str):
        config = mmcv.Config.fromfile(config)
    elif not isinstance(config, mmcv.Config):
        raise TypeError('config must be a filename or Config object, '
                        f'but got {type(config)}')
    config.model.pretrained = None
    config.test_cfg.metrics = None
    model = build_model(config.model, test_cfg=config.test_cfg)
    if checkpoint is not None:
        checkpoint = load_checkpoint(model, checkpoint)
    model.cfg = config  # save the config in the model for convenience
    model.eval()
    return model
class Worker:
    def __init__(self):
        self.checkpoint_path = 'checkpoints/RealBasicVSR_x4.pth'
        self.config = 'configs/realbasicvsr_x4.py'
        self.is_save_as_png = True
        self.max_seq_len = 2
        self.model = init_model(self.config, self.checkpoint_path)
    def do_pic(self, input_image_path: str, output_dir: str):
        inputs = []
        img = mmcv.imread(input_image_path, channel_order='rgb')
        ext = os.path.basename(input_image_path).split('.')[-1]
        inputs.append(img)
        inputs.append(img)
        for i, img in enumerate(inputs):
            img = torch.from_numpy(img / 255.).permute(2, 0, 1).float()
            inputs[i] = img.unsqueeze(0)
        inputs = torch.stack(inputs, dim=1)
        # map to cuda, if available
        cuda_flag = False
        if torch.cuda.is_available():
            model = self.model.cuda()
            cuda_flag = True
        with torch.no_grad():
            if isinstance(self.max_seq_len, int):
                outputs = []
                for i in range(0, inputs.size(1), self.max_seq_len):
                    imgs = inputs[:, i:i + self.max_seq_len, :, :, :]
                    if cuda_flag:
                        imgs = imgs.cuda()
                    outputs.append(self.model(imgs, test_mode=True)['output'].cpu())
                outputs = torch.cat(outputs, dim=1)
            else:
                if cuda_flag:
                    inputs = inputs.cuda()
                outputs = self.model(inputs, test_mode=True)['output'].cpu()
        mmcv.mkdir_or_exist(output_dir)
        for i in range(0, outputs.size(1)):
            output = tensor2img(outputs[:, i, :, :, :])
            filename = '{}.{}'.format(uuid.uuid1().hex, ext)
            if self.is_save_as_png:
                file_extension = os.path.splitext(filename)[1]
                filename = filename.replace(file_extension, '.png')
            result_path = os.path.join(output_dir, filename)
            mmcv.imwrite(output, result_path)
            break
if __name__ == '__main__':
    worker = Worker()
    worker.do_pic('data/136.jpeg', 'results/')


代码说明


1、如果在真实项目中使用的话,worker对象可以在项目启动中创建,不需要每次调用时候创建。


2、主要使用方法为do_pic方法,入参分别为:需要超分的照片地址,以及最后生成的目录地址。


3、最终输出的照片名使用uuid进行命名,如果需要自定义的话,可以看着调整。


4、输出的文件格式不一定需要是png,上面的类初始化有bool选项,自行调整。


测试一下代码,先看一下图片。


image.png


执行结果


2022-05-08 15:47:54,792 - mmedit - INFO - load checkpoint from torchvision path: torchvision://vgg19

load checkpoint from local path: checkpoints/RealBasicVSR_x4.pth

/home/zhangmaolin/.local/lib/python3.7/site-packages/torch/functional.py:445: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at  ../aten/src/ATen/native/TensorShape.cpp:2157.)

 return _VF.meshgrid(tensors, **kwargs)  # type: ignore[attr-defined]


最终图片输出

屏幕快照 2022-06-08 下午11.46.00.png



OK,没什么问题了。


总结

本文主要是造个轮子吧,相信有经验的可以自己改造,包括视频处理也可以不要使用作者的demo,自己优化一下逻辑,性能应该都跟得上。提供思路吧,视频拆分图片组和音频,处理完之后压缩为一个视频。


多说一点,大家如果想联系我问一些问题,讨论交流啊,可以加文章底部的联系名片,有时候大家私信我,我看不到或者忘了回复了,很僵。


分享:


       年轻的好处是可原谅的率真、大胆、肆无忌惮的把内心所爱、所要、所憎、所恨的不扣修饰宣诸于口。——《挪威的森林》


相关文章
|
7天前
|
JavaScript 前端开发 开发者
探索 DrissionPage: 强大的Python网页自动化工具
DrissionPage 是一个基于 Python 的网页自动化工具,结合了浏览器自动化的便利性和 requests 库的高效率。它提供三种页面对象:ChromiumPage、WebPage 和 SessionPage,分别适用于不同的使用场景,帮助开发者高效完成网页自动化任务。
51 4
|
16天前
|
机器学习/深度学习 TensorFlow 算法框架/工具
利用Python和TensorFlow构建简单神经网络进行图像分类
利用Python和TensorFlow构建简单神经网络进行图像分类
39 3
|
1月前
|
存储 JSON API
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
51 7
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
|
29天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
30 2
|
29天前
|
C语言 开发者 Python
探索Python中的列表推导式:简洁而强大的工具
【10月更文挑战第21天】在Python的世界里,代码的优雅与效率同样重要。列表推导式(List Comprehensions)作为一种强大而简洁的工具,允许开发者通过一行代码完成对列表的复杂操作。本文将深入探讨列表推导式的使用方法、性能考量以及它如何提升代码的可读性和效率。
|
1月前
|
自然语言处理 算法 数据挖掘
探讨如何利用Python中的NLP工具,从被动收集到主动分析文本数据的过程
【10月更文挑战第11天】本文介绍了自然语言处理(NLP)在文本分析中的应用,从被动收集到主动分析的过程。通过Python代码示例,详细展示了文本预处理、特征提取、情感分析和主题建模等关键技术,帮助读者理解如何有效利用NLP工具进行文本数据分析。
49 2
|
1月前
|
测试技术 Python
Python MagicMock: Mock 变量的强大工具
Python MagicMock: Mock 变量的强大工具
|
1月前
|
存储 Python
python数据类型、debug工具(一)
python数据类型、debug工具(一)
|
1月前
|
JSON API 数据格式
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(2)
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(2)
52 0
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(2)
|
26天前
|
C语言 Python
探索Python中的列表推导式:简洁而强大的工具
【10月更文挑战第24天】在Python编程的世界中,追求代码的简洁性和可读性是永恒的主题。列表推导式(List Comprehensions)作为Python语言的一个特色功能,提供了一种优雅且高效的方法来创建和处理列表。本文将深入探讨列表推导式的使用场景、语法结构以及如何通过它简化日常编程任务。
下一篇
无影云桌面