如何通过分割模型完成证件照制作

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 语义分割或者抠图完之后,我们会获取一个带有alpha通道的png图像。可以通过该图像进一步加工,更换前景的背景图片,从而实现证件照制作、换背景、换天等的玩法。本文主要介绍如何对alpha通道进行原图加工,从而实现证件照功能。

通过https://developer.aliyun.com/article/1061353?spm=a2c6h.14164896.0.0.2cb72f4aSW18B1 提到的分割能力,我们可以很轻松的获取一张带有mask的png图片,获取该图片之后,我们可以通过下述方法实现替换背景的功能。这里我拿python做示例代码。

# *- author: ALIBABA DAMO AIC -*
# *- date: 2020/12/14 -*
import cv2
import numpy as np
def picture_mergeBG(args):
    assert (args.files is not None and len(args.files) > 3), "parameters wrong, use -h for details!"
    of_file = args.files[3]
    [sc_image, viapi_image, bg_image] = [cv2.imread(img_file, cv2.IMREAD_UNCHANGED) for img_file in
                                                                args.files[0:3]]
    assert (sc_image is not None and viapi_image is not None and bg_image is not None), "read image files error!"
    h, w, c = sc_image.shape
    viapi_image = cv2.resize(viapi_image, (w, h))
    bg_image = cv2.resize(bg_image, (w, h))
    if len(viapi_image.shape) == 2:
        mask = viapi_image[:, :, np.newaxis]
    if viapi_image.shape[2] == 4:
        mask = viapi_image[:, :, 3:4]
    elif viapi_image.shape[2] == 3:
        mask = viapi_image[:, :, 0:1]
    else:
        raise Exception("invalid image mask!")
    mask = mask / 255.0
    sc_image = sc_image.astype(np.float)
    bg_image = bg_image.astype(np.float)
    of_image = (sc_image - bg_image) * mask + bg_image
    of_image = np.clip(of_image, 0, 255)
    cv2.imwrite(of_file, of_image)


相关文章
|
5月前
|
人工智能 搜索推荐
StableIdentity:可插入图像/视频/3D生成,单张图即可变成超人,可直接与ControlNet配合使用
【2月更文挑战第17天】StableIdentity:可插入图像/视频/3D生成,单张图即可变成超人,可直接与ControlNet配合使用
105 2
StableIdentity:可插入图像/视频/3D生成,单张图即可变成超人,可直接与ControlNet配合使用
|
5月前
|
机器学习/深度学习 算法 数据可视化
一图胜千言:EBImage库分割和标注让你的图像说话
一图胜千言:EBImage库分割和标注让你的图像说话
161 0
|
3月前
动态人物抠图换背景 MediaPipe
动态人物抠图换背景 MediaPipe
|
4月前
|
编解码 文字识别 算法
视觉智能开放平台产品使用合集之通用分割和通用高清分割、人体分割和高清人体分割具体有哪些区别
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
5月前
|
JSON 算法 Shell
【数据集】以人脸关键点为例讲解:如何通过开源项目快速制作关键点数据集
【数据集】以人脸关键点为例讲解:如何通过开源项目快速制作关键点数据集
122 0
|
机器学习/深度学习 编解码 算法
【阿里云OpenVI-视觉生产系列之图片上色】照片真实感上色算法DDColor ICCV2023论文深入解读
图像上色是老照片修复的一个关键步骤,本文介绍发表在 ICCV 2023 上的最新上色论文 DDColor
2640 10
【阿里云OpenVI-视觉生产系列之图片上色】照片真实感上色算法DDColor ICCV2023论文深入解读
|
机器学习/深度学习 人工智能 达摩院
!!抠图分割-在线自动抠图-快速抠图-0元免费调用33333次!!
视觉智能开放平台发福利啦~~大家快来跟我一起薅羊毛!!!
|
人工智能 编解码 移动开发
NeRF基于线稿生成逼真三维人脸,细节风格随意改,论文已上SIGGRAPH
NeRF基于线稿生成逼真三维人脸,细节风格随意改,论文已上SIGGRAPH
450 0
|
人工智能 人机交互
可组合扩散模型主打Any-to-Any生成:文本、图像、视频、音频全都行
可组合扩散模型主打Any-to-Any生成:文本、图像、视频、音频全都行
173 0
|
机器学习/深度学习 人工智能 文字识别
扩散模型生成带汉字图像,一键输出表情包:OPPO等提出GlyphDraw
扩散模型生成带汉字图像,一键输出表情包:OPPO等提出GlyphDraw
170 0