精准生成Fake人脸!Amazon全新GAN模型给你全方位无死角美颜

简介: 近日,来自 Amazon One 的研究人员提出了一个训练 GAN 的框架,可以对生成的图像进行显式控制。该框架能够通过设置确切的属性(例如年龄,姿势,表情等)来控制生成的图像。

微信图片_20220112093747.png


Amazon One团队最近提出了一个可以对生成的图像进行显式属性控制的GAN训练框架,能够通过设置确切的属性来控制生成的图像,如年龄、姿势、表情等。
 


微信图片_20220112093757.png


这篇论文目前已经发布在arxiv上,并且在Google网盘中有相应的补充说明。 目前大多数编辑GAN生成的图像的方法都是通过利用隐空间解构属性来实现部分控制,这些属性是在标准GAN训练后隐式获得的。这种方法能够改变某些属性的相对强度,但不能显式地设置它们的值。 而最近提出的方法,是为显式的准确控制人脸属性而设计的,利用可变形的3D人脸模型来实现GAN中的细粒度控制能力。 


微信图片_20220112093759.gif


与以往方法不同的是,这种控制不受限于可变形的三维人脸模型参数,并且可以扩展到人脸领域之外。 使用对比学习,获得了具有明确分解隐空间的GAN。这种分解被用来训练控制编码器,将人类可解释的输入映射到合适的隐向量,从而允许显式的控制。

 微信图片_20220112093801.gif


在人脸领域,研究人员展示了对身份、年龄、姿势、表情、头发颜色和照明的控制,还演示了我们的框架在画像和狗图像生成领域的控制能力,证明了新的方法在质量和数量上都达到了SOTA。


 微信图片_20220112093803.png


在第一阶段,构建每一个batch的每个属性都有一对隐向量,共享一个相应的子向量。 除了对抗性损失外,该批图像中的每张图像都会以对比的方式,逐个属性地与其他所有图像进行比较,并考虑到它的子向量是相同还是不同。 在第二阶段,编码器被训练成将可解释的参数映射到合适的隐向量。 在推理阶段,是通过将第k个编码器输入设置为所需值,实现对属性k的显式控制。 


微信图片_20220112093805.gif


对光线、角度和表情的显式控制效果: 


微信图片_20220112093808.png


研究人员使用了ArcFace提取生成图像的嵌入向量,具体做法是生成10K个共享ID属性的图像对和具有不同的姿势、照明和表情属性的图像。 对发色和年龄的控制效果: 


微信图片_20220112093810.png微信图片_20220112093811.png


为了验证模型确实对输出有明确的控制,研究人员进行了控制精度的比较。从FFHQ中随机选取10K张图像,并对其属性进行预测,以产生一个在真实图像中出现的可行属性池。 还可以实现在保持其他属性不变的情况下,改变绘画的艺术风格:

 微信图片_20220112093813.png


对于喜欢养宠物的人来说,也可以显式控制生成的狗狗图像的一些属性:


微信图片_20220112093815.png


同时,不只可以改变一个属性,还可以同时控制多个属性值: 


微信图片_20220112093817.png


通过测试Amazon One的可控GAN模型,本以为现在的美颜工具已经十分好用了,看来未来还会有更加惊艳的功能可以期待。  


参考链接:


https://alonshoshan10.github.io/gan_control/


论文地址:


https://arxiv.org/pdf/2101.02477.pdf

相关文章
|
2月前
|
机器学习/深度学习 自然语言处理 人机交互
音频基座大模型FunAudioLLM体验评测
一文带你详细了解音频基座大模型FunAudioLLM
315 5
|
5月前
|
存储 API Android开发
视觉智能开放平台产品使用合集之生成式图像超分和图像超分有什么区别
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
算法
视觉智能平台在图片识别方面有一定的能力
视觉智能平台在图片识别方面有一定的能力
58 1
|
机器学习/深度学习 人工智能 计算机视觉
视觉智能平台的人脸特征值数据
视觉智能平台的人脸特征值数据
64 1
|
开发工具 计算机视觉 文字识别
接入阿里视觉智能平台免费体验—人脸人体识别ocr与二次元风格转化使用
接入阿里视觉智能平台免费体验—人脸人体识别ocr与二次元风格转化使用
21364 4
接入阿里视觉智能平台免费体验—人脸人体识别ocr与二次元风格转化使用
|
机器学习/深度学习 JavaScript 算法
AIGC背后的技术分析 | 人脸识别和人脸检测
机器学习案例:人脸识别和人脸检测
305 0
AIGC背后的技术分析 | 人脸识别和人脸检测
|
算法 TensorFlow 算法框架/工具
基于Aidlux平台的人脸关键点检测以及换脸算法
Face Mesh:468个人脸部关键点精确定位并支持多个人同时检测,支持关键点3D坐标。 Face Swap:超好玩的换脸算法,把明星的脸融合到你的身体上,让你也有星范。
|
人工智能 计算机视觉 Ruby
CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(二)
CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(二)
606 0
|
数据采集 SQL 编解码
CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(一)
CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(一)
333 0
|
机器学习/深度学习 JSON 编解码
伯克利开源首个泊车场景下的高清数据集和预测模型,支持目标识别、轨迹预测
伯克利开源首个泊车场景下的高清数据集和预测模型,支持目标识别、轨迹预测
236 0