带你读《2022技术人的百宝黑皮书》——移动端人脸风格化技术的应用(5)

简介: 带你读《2022技术人的百宝黑皮书》——移动端人脸风格化技术的应用(5)

带你读《2022技术人的百宝黑皮书》——移动端人脸风格化技术的应用(4) https://developer.aliyun.com/article/1243348?groupCode=taobaotech




我在上文讨论“模型丰富度”的时候说过:


这(低丰富度)会使得后续应用模型生成的风格化数据集分布过于单调,不利于U-GAT-IT的训练。


这是为什么么?因为CycleGAN的框架要求两个域的数据要基本符合双射关系,否则域X翻译到域Y后,就很容易发生语义丢失。而StyleGAN2 inversion生成的图像存在一个问题,就是大部分的背景信息会丢失,变成简单的、模糊的背景(当然,有一些最新的论文极大缓解了这个问题,例如腾讯AI Lab的High-Fidelity GAN Inversion)。如果使用数据集Y和真实人脸数据集X直接训练U-GAT-IT,就很容易发生数据集X生成的对应图像Xgen的背景丢失大量语义信息,导致很难形成有效的图像对。


于是针对此提出了改进U-GAT-IT以实现固定背景的两种方式:基于增加背景约束的Region-based U-GAT-IT算法改进,基于增加掩膜分支的Mask U-GAT-IT算法改进。这两种方式存在ID感和风格化程度强弱和均衡的差异,结合超参的调整,为我们的ID感和风格化提供了一个控制余地。同时,我们也进行网络结构改进、模型EMA、边缘提升等手段进一步提升生成效果。


image.png

左为原图,中间和右边是非监督图像翻译的生成效果,差异在于对算法进行了ID感和风格化程度的控制


最终,使用训练好的生成模型对真人图像数据集进行推理翻译得到对应的配对风格化数据集。


有监督图像翻译


基于MNN不同算子及模块在移动端上的计算效率的研究,进行 移动端模型结构设计 及 模型计算量分档,并结合对CartoonGAN、AnimeGAN、pix2pix等研究的改进,最终得到了 轻量、高清晰度、高风格化程度的移动端模型:


image.png


*清晰度使用 拉普拉斯梯度值求和 作为统计指标


image.png


带你读《2022技术人的百宝黑皮书》——移动端人脸风格化技术的应用(6) https://developer.aliyun.com/article/1243345?groupCode=taobaotech

相关文章
|
机器学习/深度学习 人工智能 编解码
AI人像特效之「一键生成N次元虚拟形象」
为了零成本低门槛地提供极致酷炫的人像玩法,我们提出了一套人像风格化通用框架「AI Maleonn」AI 版神笔马良,用于一键生成风格百变的人物虚拟形象,在风格上涵盖手绘、3D、日漫、艺术特效、铅笔画等多种风格,同时可以支持面向小样本的专属风格定制,利用少量目标风格图即可实现快速迁移拓展;在处理维度上,不仅适用于生成头部效果,更支持全图精细化纹理转换,兼容多人场景;在模型鲁棒性上,有效克服了多角度姿态、面部遮挡等各类复杂场景,整体稳定性大大提升。
|
机器学习/深度学习 人工智能 算法
【视觉智能产品速递——人物动漫化能力上新】
VIAPI—人物动漫化!新增风格版本发布。 产品功能:人物动漫化——输入一张人物图像,生成其二次元卡通形象,返回卡通化后的结果图像。 🔥🔥🔥 本次更新风格:国风工笔画、港漫风
1662 3
【视觉智能产品速递——人物动漫化能力上新】
|
11月前
|
Linux 网络安全 数据安全/隐私保护
centos开启samba服务
通过以上步骤,您已成功在CentOS系统上安装、配置并启动了Samba服务,并且可以通过Windows或Linux客户端访问共享目录。Samba为跨平台文件共享提供了强大的支持,配置灵活且易于管理。无论是简单的家庭网络共享还是企业级文件服务器,Samba都能胜任。通过合理的配置和访问控制,您可以确保文件共享的安全性和便利性。
1006 74
|
JSON 前端开发 Java
【SpringMVC】基础入门(1)
spirngMVC,RequestMapping建立连接,RequestController,Requestparam,RequestBody传递参数、对象、数组、集合、JSON数据,JSON字符串和JAVA对象的转换
|
安全 C++
超级好用的C++实用库之环形内存池
超级好用的C++实用库之环形内存池
359 5
|
Android开发 开发者
Android开发之通过渲染纹理展示地球仪
该文阐述了如何使用OpenGL为三维物体添加纹理,以增强其真实感。纹理坐标是二维的,用于标记摊平后的“布料”对应物体的哪个部位,类似裁缝制作衣服的过程。在OpenGL中,启用纹理和深度测试是关键,还包括设置纹理参数、分配纹理编号、绑定位图材质等步骤。计算材质的纹理坐标后,通过`glDrawArrays`结合顶点和纹理坐标逐个贴图。最终示例展示了将世界地图贴到球体上形成逼真的地球仪效果。通过控制旋转、平移和缩放,能实现简单的三维动画效果。
330 2
Android开发之通过渲染纹理展示地球仪
|
文字识别 小程序 Java
视觉智能开放平台产品使用合集之如何在uniapp中调用图像识别api
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
229 0
|
前端开发 数据安全/隐私保护
开发指南016-前端图标规范
平台为了保证统一性,做了很多约定,例如按钮图标等
|
存储 人工智能 自动驾驶
创新场景|云上腾飞的自动驾驶,智能吉利背后藏着什么?
如今的全球化汽车产业竞争中,车企将竞争焦点纷纷聚焦到了智算中心的建设上。
485 2
创新场景|云上腾飞的自动驾驶,智能吉利背后藏着什么?
|
开发工具 git
在偶有几次git commit的时候出现大量额外文件选择提交?
在偶有几次git commit的时候出现大量额外文件选择提交?
361 1

热门文章

最新文章