达摩卡通化模型的体验

简介: 目标场景:艺术创作、社交娱乐、隐私保护场景,自动化生成卡通肖像。

首先我先向大家介绍一下我自己,我是一名计算机在读硕士生,今天进行一下阿里云产品的评测.我体验的师达摩卡通化模型的使用.

我先对我们在社区可以获得什么做几点的介绍:

  • 免费使用平台提供的预训练模型,支持免费下载运行(这点我想大家都会实实在在感到实惠吧,传统的我们需要自己去对数据进行处理,对不同的参数进行修改最后慢慢的训练出一个模型作为预模型的使用)
  • 一行命令实现模型预测,简单快速验证模型效果(一行命令可以进行模型预测我是从来没想到,但是实际体验了确实是,这个功能绝了)
  • 用自己的数据对模型进行调优,定制自己的个性化模型(模型及参数的优化直接关系到我们的实验成败一点也不夸张)

社区会给我们提供到什么:(此处我都是列举的与我自己在学校跑实验联系紧密的)

  • 丰富的预训练SOTA模型

覆盖NLP、CV、Audio等多领域的具有竞争力的SOTA模型,更有行业领先的多模态大模型,全部免费开放下载以及使用。(覆盖的模型越多对开发者的福音越高,可以方便大家优中选优)

  • 多元开放的数据集

汇集行业和学术热门的公开数据集,更有阿里巴巴集团贡献的专业领域数据集等你来探索。(现在市场上的数据集很多,但是涵盖面全的数据集还是很少的,官方给出的数据集还是不错的)

  • 即开即用的在线开发平台

一键开启在线notebook实训平台,集成官方镜像免除环境安装困扰,链接澎湃云端算力,体验便捷的交互式编程。(jupyter notebook对开发者是非常方便的,随时可以知道自己编写的代码是否可以正常的运行)

  • 灵活的模型框架与部署方式

兼容主流AI框架,更好地实现模型迁移;多种模型训练与服务部署方式,提供更多自主可控的选择。(部署一旦简化可以减少大家的工作量,还是减轻压力的)

阿里云的官方文档给我们直观的分了三大模块,给了相应的入口,方便大家各取所需.

image.png

接下来我就进入正题:

第一步,我们首先需要在社区进行注册



第二步,登录社区进入社区的主页面



第三步,选择今天的主题,达摩卡通化模型的体验,我们点击这一栏进入主页面,我们需要做的是在Notebook中进行打开,官方设置的是Jupyter的笔记本,这一点对于本人而言是比较友好地,因为我一直在使用这一款笔记本,可以直接进行运行.



打开笔记本之后,如下图所示:


此时,我们需要做的一点就是创建一个新的python文件,然后将使用模型所需要的代码进行输入.

import cv2
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
img_cartoon = pipeline(Tasks.image_portrait_stylization, 
                       model='damo/cv_unet_person-image-cartoon_compound-models')
result = img_cartoon('input.png')
cv2.imwrite('result.png', result[OutputKeys.OUTPUT_IMG])
print('finished!')

此处需要注意的是:这里的python文件以及照片的导入都需要我们自己进行,照片的导入需要注意的是必须与python文件在同一级目录下,如果不在同一级目录下,我们在运行的时候一定要注意将照片的路径完整的导入进来,不然容易造成运行错误.



如上:我用红框圈住的位置就是修改照片的位置.

在一切设置完毕后,接下来我们就进行代码的运行来验证模型的效果,我们需要打开控制台,


以下是Python文件的运行代码:


此处出现finished以后即是运行完毕,我们可以通过result.jpg进行查看

注意: 如果我们导入的是.jpg文件,那么我们导出设置一定得是相同格式,不然容易出现意想不到的错误.


最后我们来进行效果的查看.

首先我展示的是原图片



接下来我们展示运行结束卡通化的图片



最后,我进行一个总结:

  1. 官方文档对于开发者还是友好的,但是对于小白需要将指导文档更加的详细一些,注意事项提醒一些.
  2. 进入jupyter笔记本之后的操作步骤,怎么创建Python文件,怎么进行照片导入以及格式的注意,在评测阶段最好整理的越完善越好,这样用户体验更好一些.
  3. python文件创建好之后,怎么进行运行官方文档也有必要说一下,帮助大家更快的实现效果,避免时间的浪费.

我们的官方学习文档的链接地址如下:

学习文档链接

我们的官方模型库地址链接如下:

模型库使用链接

我们的数据集地址链接如下:(数据集还是很全面的,起码我是比较看好的)

数据集学习链接

相关文章
|
数据可视化 定位技术
svg数据可视化地图实战笔记
svg数据可视化地图实战笔记
417 0
|
Linux
linux系统中利用QT实现音乐播放器的功能
linux系统中利用QT实现音乐播放器的功能
409 0
|
3月前
|
缓存 Java 索引
2025 年 Java 面试必备最常见 200 + 面试题及答案解析
这是一份针对Java面试的综合技术方案与应用实例文档,涵盖Java基础(JDK/JRE、字符串、IO流)、容器(ArrayList/LinkedList、HashMap)、多线程(线程创建、同步、线程池)、数据库(MySQL索引、Redis缓存穿透)及Spring框架(IOC容器、热部署)等核心模块。通过详细解析常见面试题,帮助读者深入理解并掌握Java核心技术,为应对面试提供全面指导。此外,还涉及反射、设计模式、JVM调优等进阶内容,助力开发者全面提升技能。代码示例可从提供的链接下载。
764 6
|
10月前
|
JavaScript 前端开发 安全
document.domain 与 window.location 有什么不同
document.domain 与 window.location 有什么不同
169 5
|
10月前
|
Python
多进程同步之文件锁
【10月更文挑战第16天】文件锁是一种常用的多进程同步机制,它可以用于确保多个进程在访问共享资源时的互斥性。在使用文件锁时,需要注意锁的粒度、释放、竞争和性能等问题。通过合理使用文件锁,可以提高多进程程序的正确性和性能
|
Ubuntu Linux 开发工具
升级openssh前安装zlib报异常configure aborting
【8月更文挑战第22天】当升级OpenSSH前安装zlib遇到“configure aborting”异常,可尝试:1) 检查并确保所需依赖项(如gcc、make)已安装且版本兼容;2) 核实环境变量(如`PATH`, `LD_LIBRARY_PATH`)正确无误;3) 确认zlib版本与系统架构及OS版本匹配;4) 手动配置编译参数(如`--prefix`, `--with-pic`);5) 仔细审查configure脚本输出的错误信息;6) 在相关社区寻求帮助或查阅官方文档。遵循上述步骤有助于解决安装问题,顺利完成OpenSSH升级。
369 8
|
缓存 安全 Linux
Linux 设备驱动程序(二)(上)
Linux 设备驱动程序(二)
152 1
|
搜索推荐 安全 网络安全
AES 加密解密技术原理模式和实践
AES (Advanced Encryption Standard), aka Rijndael, is a symmetric encryption algorithm offering high security and speed over DES.
|
关系型数据库 MySQL 应用服务中间件
拼团+秒杀+优惠折扣+个人免签双端商城源码
可用拼团+秒杀+优惠折扣+个人免签双端商城源码,全功能完美双端,对接个人免签支付。 这款商城源码非常完整,整体也非常简洁,功能全面,没有那么多冗杂的多余页面和无用代码,拿到后优化了下整体代码,对接了免签支付。
193 1
|
定位技术 API
通过经纬度获得地址与城市名称(原创)
通过经纬度获得地址与城市名称(原创)
438 3