精准生成Fake人脸!Amazon全新GAN模型给你全方位无死角美颜

简介: 近日,来自 Amazon One 的研究人员提出了一个训练 GAN 的框架,可以对生成的图像进行显式控制。该框架能够通过设置确切的属性(例如年龄,姿势,表情等)来控制生成的图像。

微信图片_20220112093747.png


Amazon One团队最近提出了一个可以对生成的图像进行显式属性控制的GAN训练框架,能够通过设置确切的属性来控制生成的图像,如年龄、姿势、表情等。
 


微信图片_20220112093757.png


这篇论文目前已经发布在arxiv上,并且在Google网盘中有相应的补充说明。 目前大多数编辑GAN生成的图像的方法都是通过利用隐空间解构属性来实现部分控制,这些属性是在标准GAN训练后隐式获得的。这种方法能够改变某些属性的相对强度,但不能显式地设置它们的值。 而最近提出的方法,是为显式的准确控制人脸属性而设计的,利用可变形的3D人脸模型来实现GAN中的细粒度控制能力。 


微信图片_20220112093759.gif


与以往方法不同的是,这种控制不受限于可变形的三维人脸模型参数,并且可以扩展到人脸领域之外。 使用对比学习,获得了具有明确分解隐空间的GAN。这种分解被用来训练控制编码器,将人类可解释的输入映射到合适的隐向量,从而允许显式的控制。

 微信图片_20220112093801.gif


在人脸领域,研究人员展示了对身份、年龄、姿势、表情、头发颜色和照明的控制,还演示了我们的框架在画像和狗图像生成领域的控制能力,证明了新的方法在质量和数量上都达到了SOTA。


 微信图片_20220112093803.png


在第一阶段,构建每一个batch的每个属性都有一对隐向量,共享一个相应的子向量。 除了对抗性损失外,该批图像中的每张图像都会以对比的方式,逐个属性地与其他所有图像进行比较,并考虑到它的子向量是相同还是不同。 在第二阶段,编码器被训练成将可解释的参数映射到合适的隐向量。 在推理阶段,是通过将第k个编码器输入设置为所需值,实现对属性k的显式控制。 


微信图片_20220112093805.gif


对光线、角度和表情的显式控制效果: 


微信图片_20220112093808.png


研究人员使用了ArcFace提取生成图像的嵌入向量,具体做法是生成10K个共享ID属性的图像对和具有不同的姿势、照明和表情属性的图像。 对发色和年龄的控制效果: 


微信图片_20220112093810.png微信图片_20220112093811.png


为了验证模型确实对输出有明确的控制,研究人员进行了控制精度的比较。从FFHQ中随机选取10K张图像,并对其属性进行预测,以产生一个在真实图像中出现的可行属性池。 还可以实现在保持其他属性不变的情况下,改变绘画的艺术风格:

 微信图片_20220112093813.png


对于喜欢养宠物的人来说,也可以显式控制生成的狗狗图像的一些属性:


微信图片_20220112093815.png


同时,不只可以改变一个属性,还可以同时控制多个属性值: 


微信图片_20220112093817.png


通过测试Amazon One的可控GAN模型,本以为现在的美颜工具已经十分好用了,看来未来还会有更加惊艳的功能可以期待。  


参考链接:


https://alonshoshan10.github.io/gan_control/


论文地址:


https://arxiv.org/pdf/2101.02477.pdf

相关文章
|
18天前
|
机器学习/深度学习 存储 监控
数据分享|Python卷积神经网络CNN身份识别图像处理在疫情防控下口罩识别、人脸识别
数据分享|Python卷积神经网络CNN身份识别图像处理在疫情防控下口罩识别、人脸识别
|
8月前
|
机器学习/深度学习 人工智能 计算机视觉
视觉智能平台的人脸特征值数据
视觉智能平台的人脸特征值数据
40 1
|
10月前
|
算法 TensorFlow 算法框架/工具
基于Aidlux平台的人脸关键点检测以及换脸算法
Face Mesh:468个人脸部关键点精确定位并支持多个人同时检测,支持关键点3D坐标。 Face Swap:超好玩的换脸算法,把明星的脸融合到你的身体上,让你也有星范。
|
机器学习/深度学习 JavaScript 算法
AIGC背后的技术分析 | 人脸识别和人脸检测
机器学习案例:人脸识别和人脸检测
238 0
AIGC背后的技术分析 | 人脸识别和人脸检测
|
机器学习/深度学习 JSON 编解码
伯克利开源首个泊车场景下的高清数据集和预测模型,支持目标识别、轨迹预测
伯克利开源首个泊车场景下的高清数据集和预测模型,支持目标识别、轨迹预测
167 0
|
机器学习/深度学习 达摩院 算法
Contextual Transformer端到端语音识别文本定制技术,可显著提升热词召回及整体识别率
Contextual Transformer端到端语音识别文本定制技术,可显著提升热词召回及整体识别率
246 0
|
达摩院
三分钟视频|看懂达摩院语音降噪模型训练全过程
三分钟视频|看懂达摩院语音降噪模型训练全过程
154 0
|
机器学习/深度学习 人工智能 文字识别
Yolov5+图像分割+百度AI接口——车牌实时检测识别系统
Yolov5+图像分割+百度AI接口——车牌实时检测识别系统
632 0
Yolov5+图像分割+百度AI接口——车牌实时检测识别系统
|
人工智能 编解码 自然语言处理
体验人像美肤模型
人像美肤模型对输入含有人像的图像进行处理,无需任何额外输入,实现脸部皮肤区域匀肤(处理痘印、肤色不均等)、去瑕疵(脂肪粒、斑点、痣等)及全身皮肤区域美白。模型仅对皮肤区域进行处理,不影响其他区域。
547 0
体验人像美肤模型
|
人工智能 安全 搜索推荐
人脸识别在当今世界的重要性是什么?
鉴于全球范围内的 COVID-19 流行病,我们可能会期待对面部识别等生物识别技术进行更多投资。
人脸识别在当今世界的重要性是什么?

热门文章

最新文章