体验达摩卡通化模型

简介: 输入一张人物图像,实现端到端全图卡通化转换,生成二次元虚拟形象,返回卡通化后的结果图像。

image.png

达摩卡通化模型介绍

达摩卡通化模型是基于域校准翻译的人像卡通化模型,通过使用者输入一张人物图像,实现端到端全图卡通化转换,生成二次元虚拟形象,返回卡通化后的结果图像。该模型采用一种全新的域校准图像翻译模型DCT-Net(Domain-Calibrated Translation),利用小样本的风格数据,即可得到高保真、强鲁棒、易拓展的人像风格转换模型,并通过端到端推理快速得到风格转换结果。

达摩卡通化模型使用方式和范围

使用方式:

  • 直接推理,在任意真实人物图像上进行直接推理;

使用范围:

  • 包含人脸的人像照片,人脸分辨率大于100x100,总体图像分辨率小于3000×3000,低质人脸图像建议预先人脸增强处理。

目标场景:

  • 艺术创作、社交娱乐、隐私保护场景,自动化生成卡通肖像。

模型的使用和推理流程

使用:

  • 在ModelScope框架上,提供输入图片,即可以通过简单的Pipeline调用来使用人像卡通化模型。

推理流程:
预处理

  • 人脸关键点检测
  • 人脸提取&对齐,得到256x256大小的对齐人脸

推理

  • 为控制推理效率,人脸及背景resize到指定大小分别推理,再背景融合得到最终效果;
  • 亦可将整图依据人脸尺度整体缩放到合适尺寸,直接单次推理

在线体验

网上找了一张女神的图片上传是体验了一下
image.png
返回的数据
image.png
原图:2.jpg
测试完成图:image.png

从上传到转换完成整个过程非常的快耗时很短。体验很好。总体来说转换后的二次元图片看着很舒服,能明显的看出来保持了原图的神韵,并且色调转换也非常的舒服。

总结

这次体验感觉还是很好的,之前在手机上使用过类似的软件去生成二次元头像,以及美化一些照片,软件经过深度开发功能还是丰富一点,如果这个模型可以深度开发一下支持多种二次元的风格并且可以自有配置那么实用性和可玩性就是增加很多。总体来说这个体验还是非常不错的。

相关文章
|
8月前
|
人工智能 自然语言处理 Java
首次体验中文竞技场大模型体验!!!
我将分别从知识常识、中文游戏、NLP专业领域、代码相关、写作创作、人类价值观六大领域测评不同模型的效果,以及一些看法。
|
24天前
|
人工智能 算法 搜索推荐
淘宝人生2的AIGC技术应用——虚拟人写真算法技术方案
淘宝人生2的AIGC技术应用——虚拟人写真算法技术方案
34 0
|
3月前
|
数据采集 人工智能 JSON
跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA)
跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA)【2月更文挑战第1天】
 跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA)
|
3月前
|
人工智能 编解码 自然语言处理
Sora文生视频模型深度剖析:全网独家指南,洞悉98%关键信息,纯干货
Sora文生视频模型深度剖析:全网独家指南,洞悉98%关键信息,纯干货
Sora文生视频模型深度剖析:全网独家指南,洞悉98%关键信息,纯干货
|
6月前
|
自然语言处理 数据挖掘 程序员
实现虚拟人直播带货具体实现需要哪些步骤
实现虚拟人直播带货具体实现需要哪些步骤
99 1
|
9月前
|
人工智能 达摩院
社区供稿 | 达摩院多模态对话大模型猫头鹰mPLUG-Owl大升级,登顶MMBench
近日,在上海人工智能实验室发布的多模态大模型榜单MMBench中,来自达摩院的mPLUG-Owl 超过MiniGPT4,LLaVA,VisualGLM等14个多模态大模型,登顶榜首。目前,mPLUG-Owl最新的预训练,SFT模型都已在ModelScope开源,欢迎大家体验。
|
12月前
|
UED
如何用ChatGPT做品牌联名方案策划?
该场景对应的关键词库(15个): 品牌、个人IP、社交话题、联名策划方案、调研分析、市场影响力、资源互补性、产品体验、传播话题、视觉形象设计、合作职权分配、销售转化、曝光目标、宣发渠道、品牌形象
227 0
|
SQL 机器学习/深度学习 算法
直播回顾 | 一文带你看透模型开发与部署
顶象人工智能专家&研发总监无常从模型平台的现状与需求出发,带大家了解了模型平台的开发环境与部署环境,并且就顶象的Xintell 模型平台 为大家做了演示。
254 0
直播回顾 | 一文带你看透模型开发与部署
|
搜索推荐 数据安全/隐私保护 UED
达摩卡通化模型的体验
目标场景:艺术创作、社交娱乐、隐私保护场景,自动化生成卡通肖像。
达摩卡通化模型的体验