达摩卡通化模型的体验

简介: 目标场景:艺术创作、社交娱乐、隐私保护场景,自动化生成卡通肖像。

首先我先向大家介绍一下我自己,我是一名计算机在读硕士生,今天进行一下阿里云产品的评测.我体验的师达摩卡通化模型的使用.

我先对我们在社区可以获得什么做几点的介绍:

  • 免费使用平台提供的预训练模型,支持免费下载运行(这点我想大家都会实实在在感到实惠吧,传统的我们需要自己去对数据进行处理,对不同的参数进行修改最后慢慢的训练出一个模型作为预模型的使用)
  • 一行命令实现模型预测,简单快速验证模型效果(一行命令可以进行模型预测我是从来没想到,但是实际体验了确实是,这个功能绝了)
  • 用自己的数据对模型进行调优,定制自己的个性化模型(模型及参数的优化直接关系到我们的实验成败一点也不夸张)

社区会给我们提供到什么:(此处我都是列举的与我自己在学校跑实验联系紧密的)

  • 丰富的预训练SOTA模型

覆盖NLP、CV、Audio等多领域的具有竞争力的SOTA模型,更有行业领先的多模态大模型,全部免费开放下载以及使用。(覆盖的模型越多对开发者的福音越高,可以方便大家优中选优)

  • 多元开放的数据集

汇集行业和学术热门的公开数据集,更有阿里巴巴集团贡献的专业领域数据集等你来探索。(现在市场上的数据集很多,但是涵盖面全的数据集还是很少的,官方给出的数据集还是不错的)

  • 即开即用的在线开发平台

一键开启在线notebook实训平台,集成官方镜像免除环境安装困扰,链接澎湃云端算力,体验便捷的交互式编程。(jupyter notebook对开发者是非常方便的,随时可以知道自己编写的代码是否可以正常的运行)

  • 灵活的模型框架与部署方式

兼容主流AI框架,更好地实现模型迁移;多种模型训练与服务部署方式,提供更多自主可控的选择。(部署一旦简化可以减少大家的工作量,还是减轻压力的)

阿里云的官方文档给我们直观的分了三大模块,给了相应的入口,方便大家各取所需.

image.png

接下来我就进入正题:

第一步,我们首先需要在社区进行注册



第二步,登录社区进入社区的主页面



第三步,选择今天的主题,达摩卡通化模型的体验,我们点击这一栏进入主页面,我们需要做的是在Notebook中进行打开,官方设置的是Jupyter的笔记本,这一点对于本人而言是比较友好地,因为我一直在使用这一款笔记本,可以直接进行运行.



打开笔记本之后,如下图所示:


此时,我们需要做的一点就是创建一个新的python文件,然后将使用模型所需要的代码进行输入.

import cv2
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
img_cartoon = pipeline(Tasks.image_portrait_stylization, 
                       model='damo/cv_unet_person-image-cartoon_compound-models')
result = img_cartoon('input.png')
cv2.imwrite('result.png', result[OutputKeys.OUTPUT_IMG])
print('finished!')

此处需要注意的是:这里的python文件以及照片的导入都需要我们自己进行,照片的导入需要注意的是必须与python文件在同一级目录下,如果不在同一级目录下,我们在运行的时候一定要注意将照片的路径完整的导入进来,不然容易造成运行错误.



如上:我用红框圈住的位置就是修改照片的位置.

在一切设置完毕后,接下来我们就进行代码的运行来验证模型的效果,我们需要打开控制台,


以下是Python文件的运行代码:


此处出现finished以后即是运行完毕,我们可以通过result.jpg进行查看

注意: 如果我们导入的是.jpg文件,那么我们导出设置一定得是相同格式,不然容易出现意想不到的错误.


最后我们来进行效果的查看.

首先我展示的是原图片



接下来我们展示运行结束卡通化的图片



最后,我进行一个总结:

  1. 官方文档对于开发者还是友好的,但是对于小白需要将指导文档更加的详细一些,注意事项提醒一些.
  2. 进入jupyter笔记本之后的操作步骤,怎么创建Python文件,怎么进行照片导入以及格式的注意,在评测阶段最好整理的越完善越好,这样用户体验更好一些.
  3. python文件创建好之后,怎么进行运行官方文档也有必要说一下,帮助大家更快的实现效果,避免时间的浪费.

我们的官方学习文档的链接地址如下:

学习文档链接

我们的官方模型库地址链接如下:

模型库使用链接

我们的数据集地址链接如下:(数据集还是很全面的,起码我是比较看好的)

数据集学习链接

相关文章
|
人工智能 Linux 开发工具
真人AI写真的制作方法-文生图换脸
AI写真最近火起来了,特别是某款现象级相机的出现,只需要上传自己的照片,就能生成漂亮的写真照,这一产品再次带火了AI绘画。今天我就来分享一个使用Stable Diffusion WebUI制作真人AI写真的方法,不用训练,快速出图。
859 1
|
7月前
|
文字识别 Linux API
视觉智能开放平台产品使用合集之图像构图美学评分的标准是什么
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
7月前
使用高性能服务器训练StableDiffusion——人物模型.safetensors
使用高性能服务器训练StableDiffusion——人物模型.safetensors
64 0
|
8月前
|
人工智能
FaceChain集成最强开源SDXL,生成人像质感拉满!
FaceChain集成最强开源SDXL,生成人像质感拉满!
91 2
|
人工智能 自然语言处理 算法
|
自然语言处理 数据挖掘 程序员
实现虚拟人直播带货具体实现需要哪些步骤
实现虚拟人直播带货具体实现需要哪些步骤
194 1
|
机器学习/深度学习 人工智能 自然语言处理
借助AIGC实现人物写真和服装试穿
大家都知道,最近两名人工智能技术的高速发展,让越来越多的企业开始关注如何将人工智能技术应用到自己的业务中。阿里云作为业内领先的云计算服务提供商,其智能开放平台在人工智能领域的技术积累和应用能力方面处于领先地位。接下来将结合阿里云的视觉智能开放平台来聊一下借助AIGC实现人物写真和服装试穿等功能。
528 1
借助AIGC实现人物写真和服装试穿
|
达摩院 算法 计算机视觉
一键抹去瑕疵、褶皱:深入解读达摩院高清人像美肤模型ABPN(2)
一键抹去瑕疵、褶皱:深入解读达摩院高清人像美肤模型ABPN
498 1
|
编解码 数据安全/隐私保护
体验达摩卡通化模型
输入一张人物图像,实现端到端全图卡通化转换,生成二次元虚拟形象,返回卡通化后的结果图像。
460 45
体验达摩卡通化模型
|
人工智能 Serverless 异构计算
【有奖体验】AI 都这么厉害了,可以看图生成文字描述!
【有奖体验】AI 都这么厉害了,可以看图生成文字描述!