AI自动生成人脸照片?还能穿越时空变幻幼时和未来的模样?

简介: AI一直是一个神秘且又令人心生敬畏和向往的概念。先且不论常人对AI的认知,就连游走在边缘的程序员们对AI也是知之甚少。

云栖号:https://yqh.aliyun.com
第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

AI一直是一个神秘且又令人心生敬畏和向往的概念。先且不论常人对AI的认知,就连游走在边缘的程序员们对AI也是知之甚少。人类对未知事情都存有莫名的兴趣,小编也是接触了AI之后才深感其博大精深。想要深入去了解AI不花些时日是不可能的,但是如果做表层的了解认知还是很容易的。下面小编就以最直白的方式带大家一起揭秘AI的神秘面纱以及其在我们身边的应用。

小故事
先看一个小故事
image

生成对抗网络有两个主角-生成器和判别器。两者经过不断对抗而让双方持续进步的过程, 这就称为对抗式学习。经由这个过程生成器能通过学习后拥有创造出有自己风格的作品的能力,这就是生成模型的中心思想。

趣解--生成对抗网络学习流程[1]
本段以上文中的故事为切入点讲解对应生成对抗网络的实现思想和流程。

故事中两个主人公小明和小华都是从零开始学习漫画的创作和鉴赏,其中小明是生成者,小华是判别者。

最初,一个不会画另一个也不会欣赏,更别说做判别了。怎么办呢?难不成要给他们办个培训班?不,当然不需要。难道就不能像金庸先生笔下描述的那样?一对神仙眷侣,一人抚琴一人起舞。常此以往,抚琴的人技艺提升了,跳舞的人也随着音乐的提升舞蹈水平也提升,反之跳舞人水平提升也会使得抚琴人技艺提升。

接下来就是生成式对抗网络思想和流程的核心:

1、先分别给小华看一些专业漫画家和小明的作品,并且事先告知小华,哪些是专业的作品(好的作品),哪些是小明的作品(暂时还不好的作品)。一直反复这样的学习过程,小华便会渐渐掌握一些鉴赏漫画作品的能力。

2、然后,小明在此时再将自己新创作的作品交予小华判断,小华在目前已具有的鉴赏能力下给予小明评判。小华会根据作品中的一些特征来给作品打分,比如,按眼睛大小打分,眼睛越大越圆分数越高。

image

3、小华打完分后,将结果反馈给小明。此时小明就会针对自己的作品的高低分来决定自己下一步该怎么优化自己的作品。小明根据上一次得到的启示重新画了一些作品(都是具有大眼的二次元妹子)给小华去评判。

4、此时小华现有的鉴赏水平已经不足以分辨出作品的好坏。因此又仔细端详专业漫画家和小明的作品,又学习到漫画人物的脸型轮廓也是一个用来判断的特征,小华就依据脸型特征来打分。于是,瓜子脸妥妥的拿高分,国字脸妥妥的低分。做完评判后,又将结果反馈给小明。小明又会依据新的标准去提升自己的绘画水平。而小华也在此过程中提升了自己的鉴赏水平。

5、最终,小明已经能够画出像专业漫画家一样优秀的漫画了,而小华也成为漫画鉴赏大师。

以上就是最简单的生成式对抗网络的中心思想和流程。将上述过程通过数理方式简化为算法就形成了如今AI领域十分红火的生成式对抗学习模型。
image
生成对抗网络运作模式

扩展--有名的生成式对抗网络
有时,我们想控制模型生成的结果,例如,想让模型生成穿短裙、腿袜的二次元漫画人物。简单的生成式对抗网络显然是做不到的。在模型的输入端放入一些条件指令,使得结果符合我们希望的方向。所以条件式生成对抗网络就应运而生。
image
条件式生成对抗网络

生成对抗网络应用[2]
目前生成式对抗网络已经被广泛应用于图像处理领域,由该网络生成的图像几可乱真。以下漫画人物就是由该模型生成。
image
生成式对抗网络生成漫画人物

下面这组图片你能分辨出来哪个是由模型生成的吗?最右边的照片是模型生成的,怎么样?辨别不出来吧!
image
我们可以经由调控给定的条件信息数值,让生成式对抗类神经网络模型产生对应的结果。前段时间火爆抖音的变老变胖特效和快手的时光机特效就应用了条件式生成对抗网络。[3]
image
抖音时光机特效 来源:品略

参考资料
[1]https://arxiv.org/abs/1809.11096

[2]https://arxiv.org/pdf/1708.05509.pdf

https://arxiv.org/pdf/1711.11585.pdf

[3]品略--被抖友安利了 x 次的“变老” App,不玩都不好意思 ~

原文发布时间:2020-01-10
本文作者:编程老大叔
本文来自阿里云云栖号合作伙伴“今日头条”,了解相关信息可以关注“今日头条

云栖号:https://yqh.aliyun.com
第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

相关文章
|
存储 人工智能 数据安全/隐私保护
HarmonyOS NEXT AI基础视觉服务-人脸对比
这是一套基于AI基础视觉服务实现的人脸对比系统,用户可通过调用设备相册选择两张图片,系统将提取人脸特征并计算相似度,最终以结构化数据形式展示对比结果(如相似度值和是否为同一人)。代码涵盖模块导入、双图选择、图像处理、人脸对比核心逻辑及UI界面构建,支持异常处理与权限管理,确保功能稳定性和兼容性。适配场景包括身份验证、人脸匹配等,具有较高的实用价值。
HarmonyOS NEXT AI基础视觉服务-人脸对比
|
人工智能 编解码 自然语言处理
DreamActor-M1:字节跳动推出AI动画黑科技,静态照片秒变生动视频
DreamActor-M1是字节跳动研发的AI图像动画框架,通过混合引导机制实现高保真人物动画生成,支持多语言语音驱动和形状自适应功能。
1070 40
DreamActor-M1:字节跳动推出AI动画黑科技,静态照片秒变生动视频
|
机器学习/深度学习 人工智能 编解码
EasyControl Ghibli:在线体验一键生成宫崎骏动画风,开源AI模型让你的照片秒变吉卜力
EasyControl Ghibli是基于扩散模型的AI工具,通过条件注入技术将普通照片转化为吉卜力动画风格,仅需100张训练样本即可精准还原标志性光影与色调特征。
1575 11
EasyControl Ghibli:在线体验一键生成宫崎骏动画风,开源AI模型让你的照片秒变吉卜力
|
人工智能 自然语言处理 人机交互
Social Media Agent:告别文案焦虑!AI自动生成高转化帖子,输入URL快速生成爆款文案
Social Media Agent 是一款由 LangChain 推出的 AI 社交媒体内容管理工具,支持 Twitter 和 LinkedIn 平台,能快速生成高质量的帖子。
893 17
Social Media Agent:告别文案焦虑!AI自动生成高转化帖子,输入URL快速生成爆款文案
|
存储 人工智能 编解码
Pippo:Meta放出AI大招!单张照片秒转3D人像多视角视频,AI自动补全身体细节
Pippo 是 Meta 推出的图像到视频生成模型,能够从单张照片生成 1K 分辨率的多视角高清人像视频,支持全身、面部或头部的生成。
1533 9
Pippo:Meta放出AI大招!单张照片秒转3D人像多视角视频,AI自动补全身体细节
|
人工智能 Linux 开发工具
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
Kiln AI 是一款开源的 AI 开发工具,支持零代码微调多种语言模型,生成合成数据,团队协作开发,自动部署。帮助用户快速构建高质量的 AI 模型。
2124 8
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
|
Web App开发 人工智能 JSON
AutoMouser:AI Chrome扩展程序,实时跟踪用户的浏览器操作,自动生成自动化操作脚本
AutoMouser是一款Chrome扩展程序,能够实时跟踪用户交互行为,并基于OpenAI的GPT模型自动生成Selenium测试代码,简化自动化测试流程。
1200 17
AutoMouser:AI Chrome扩展程序,实时跟踪用户的浏览器操作,自动生成自动化操作脚本
|
数据采集 机器学习/深度学习 人工智能
Sitcom-Crafter:动画师失业警告!AI黑科技自动生成3D角色动作,剧情脚本秒变动画
Sitcom-Crafter 是一款基于剧情驱动的 3D 动作生成系统,通过多模块协同工作,支持人类行走、场景交互和多人交互,适用于动画、游戏及虚拟现实等领域。
961 4
|
人工智能 自然语言处理 JavaScript
Aider:27.6K Star!这个终端AI编程神器能用语音改代码,自动生成Git记录并提交,接入DeepSeek斩获编程基准最高分
Aider 是一款基于命令行的开源 AI 编程助手,支持多种编程语言和主流 LLM,可自动完成代码修改、Git 提交及语音交互。
2985 1

热门文章

最新文章