阿里云视频云,用技术普惠打造平民化“虚拟人”

简介: 近日,国内首个超写实数字人 AYAYI 宣布入职阿里,成为天猫超级品牌日的数字主理人,二者将共同开启元宇宙的营销世界。在未来她将与天猫解锁多个身份,如 NFT 艺术家、数字策展人、潮牌主理人、顶流数字人等等。

近日,国内首个超写实数字人 AYAYI 宣布入职阿里,成为天猫超级品牌日的数字主理人,二者将共同开启元宇宙的营销世界。在未来她将与天猫解锁多个身份,如 NFT 艺术家、数字策展人、潮牌主理人、顶流数字人等等。

1.png

提到虚拟数字人,大家第一时间想到就是 2012 年诞生的洛天依。她的出现补了国内空白的虚拟偶像市场。虽然她最初只拥有声音与立绘,但九年来,粉丝们不断为她写歌作曲、绘制插画、制作 MMD,这些同人创作,一点点填充着最初的空白。相比于真人养成偶像,依托于 UGC 内容长大的虚拟偶像,更像是一场纯粹的养成式造星。而在 2021 年初以洛天依为代表的、次元特征的虚拟偶像开始在春晚大放光彩,这意味着国家级平台对次元文化的尊重与认可,也是虚拟与现实产生的一次有益互动。

2.png
洛天依亮相春晚节目少儿歌舞《听我说》

iiMedia Research (艾媒咨询) 数据显示,2020 年中国虚拟偶像核心产业规模为 34.6 亿元,同比增长 70.3%,预计 2021 年将达到 62.2 亿元;另一方面,随着商业价值被不断发掘,越来越多产业与虚拟偶像联系在一起,虚拟偶像带动产业规模 2020 年为 645.6 亿元,预计 2021 年为 1074.9 亿元。
而在国外的短视频平台上,虚拟数字人也是大行其道。一位名叫 Lil Miquela 的虚拟偶像,其人设是一个 19 岁混血女孩,有着可爱雀斑,长期定居在洛杉矶,拥有西班牙裔、巴西裔和美国血统的虚拟模特及音乐人。据央视网 2021 年 01 月 30 日的报道,Lil Miquela 在 2019 年的收入折合人民币大约为 7600 万。

什么是虚拟数字人?

“虚拟数字人”一词最早源于 1989 年美国国立医学图书馆发起的“可视人计划”(Visible Human Project, YHP)。2001 年, 国内以“中国数字化虚拟人体的科技问题”为主题的香山 科学会议第 174 次学术讨论会提出了“数字化虚拟人体”的概 念。这些“虚拟数字人”主要是指人体结构的可视化,以三维形式显示人体解剖结构的大小、形状、位置及器官间的相互空间关系,即利用人体信息,实现人体解剖结构的数字化。主要应用于医疗领域的人体解剖教学、临床诊疗等。

不同于上述医疗领域的数字化人体,目前网络上围绕元宇宙所讨论的虚拟数字人(以下简称“数字人”)是指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在。虚拟数字人宜具备以下三方面特征:一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;三 是拥有人的思想,具有识别外界环境、并能与人交流互动的能力。

近年来,得益于深度学习算法的突破,数字人的制作过程变成更加简单,虚拟数字人开始进入大众的视野,应用在各行各业,例如已经出现了娱乐型数字人(如虚拟主播、 虚拟偶像)、教育型数字人(如虚拟教师)、助手型数字人 (如虚拟客服、虚拟导游、智能助手)、影视数字人(如替 身演员或虚拟演员)等。不同外形、不同功能的虚拟数字人赋能影视、传媒、游戏、金融、文旅等领域,根据需求为用户提供定制化服务。

3.png
虚拟数字人产业视图 资料来源:《2020 年虚拟数字人发展白皮书 》

在实现技术方面,虚拟数字人系统一般情况下由人物形象、语音生成、动画生成、音视频 合成显示、交互等 5 个模块构成。其中最为基础的是人物形象技术,根据人物图形资源的维度,可分为 2D 和 3D 两大类,从外形上又可分为卡通、拟人、写实、超写实等风格。

4.png
资料来源:《2020 年虚拟数字人发展白皮书 》

阿里云卡通智绘:打造身边的虚拟偶像

因为虚拟人的人物形象构建方面具有一定的技术门槛,所以对普通人来说,虚拟人似乎仍停留在偶像阶段,只能“远观”。但来自阿里云视频云的团队却通过优化的算法技术,让普通人也能有机会创造属于自己的卡通形象,在虚拟世界里塑造“平民偶像”,在2021年的云栖大会开发者展区,阿里云就展示了最新技术——卡通智绘项目,吸引了近2000名体验者,成为了大会爆款。这项技术采用了隐变量映射的人脸风格化技术方案,通过机器学习算法可以把拍摄者本来的面目特征和目标训练风格做深度融合,重建面部的形状,它既符合用户脸部特征,又具有卡通的风格化,还可以跟踪用户的面部姿态和丰富的表情生成实时动画。

5.png
而这所有的技术全靠 AI 完成,对使用者而言只需通过上传一张自拍照就能自动生成符合用户人脸特点的虚拟人。
20211104161254.jpg

阿里云卡通智绘可以对输入人像图片,发掘其显著特征(如眼睛大小,鼻型等),自动化生成具有个人特色的虚拟形象(即风格化后的效果)。所谓人脸风格化,就是将真实的人脸头像转换为特定的风格头像,最常见的包括卡通风格、动漫风格、油画风格,如下图所示:

20211104161230.jpg
阿里云视频云卡通智绘效果图

得益于 AI 技术的高速发展,虚拟人已经不再是触不可及的事物,在可预见的未来,由卡通智绘创建虚拟人将作为虚拟主播、虚拟老师、虚拟客服、虚拟导游的数字化身,越来越频繁的出现在各行各业。

参考资料:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员,《2020 年虚拟数字人发展白皮书 》

扫码入群和作者一起探讨音视频技术
获取更多视频云行业最新信息👇

image.png

「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。
相关文章
|
6月前
|
边缘计算 运维 网络协议
翼鸥教育和阿里云强强联手,共创全球化云网络极致体验
近日,第6届SDWAN&SASE大会暨云网络大会在京顺利举办,在会上阿里云网络与翼鸥教育联合签署《云网络共建合作计划》,未来双方将在云网络技术层面共同投入技术研究,发挥各自领域的业务优势,合力推进云网络技术的发展,并重点在公网质量提升、网络拨测技术、广域网络调度技术等方面进行深度合作。
231 1
翼鸥教育和阿里云强强联手,共创全球化云网络极致体验
|
人工智能 编解码 云栖大会
|
人工智能 Cloud Native 调度
创新场景|智能亚运,国际大型赛事的云上新体验
本届杭州亚运会除了转播平台全面上云以外,亚运会的核心系统也是首次100%“跑”在了云上。不必像往届亚运会需要搭建和拆卸机房,云计算彻底替代传统数据中心(IDC),成为亚运会算力基础设施,从底层支持赛事系统群,向上支撑云上转播、亚运钉等智能应用,实现核心系统和应用服务的云上打通,为亚运各类智能应用提供云底座支持。
226 0
|
人工智能 编解码 开发工具
专场来袭,深度解读阿里云视频云的全智能进化
7.28,LiveVideoStackCon阿里云视频云专场
265 0
专场来袭,深度解读阿里云视频云的全智能进化
|
机器学习/深度学习 编解码 人工智能
|
弹性计算 架构师 vr&ar
2022视觉计算私享会上海站 | 助力沉浸式体验落地
听业界大咖的思想碰撞与实践分享,加速虚拟与现实交互体验
2022视觉计算私享会上海站 | 助力沉浸式体验落地
|
人工智能 编解码 搜索推荐
视频云肖长杰:视频AI科技助力短视频生态
人工智能技术是当今炙手可热的技术领域,它在制造、家居、零售、交通、安防等行业的应用已经是大势所趋。在本月云栖Techday音视频技术沙龙中,阿里云视频云产品专家肖长杰为我们分享了一些AI技术在视频中应用的小趋势,带大家回顾了AI是如何渗透到了短视频生产中的各个环节中的。
2896 0
|
人工智能 自然语言处理 安全
带你了解2022两会黑科技:阿里云视频云「AI编辑部3.0」
5G链接前后方,AI直抵采访一线,视频生产的云端化和移动化,重塑了媒体生产与传播的全流程,“AI编辑部”助力人民日报新媒体全链路上云,由此,轻量化、智能化的AI编辑部让每一次两会报道都更“劲”一步。
2312 0
带你了解2022两会黑科技:阿里云视频云「AI编辑部3.0」
|
人工智能 编解码 Cloud Native
|
存储 机器学习/深度学习 编解码
新时代大视频产业的底座,视频云创变了什么?
视频不应该被看作一个单独的行业,就像云计算同样不该被看作一个单独的行业,它们都将渗透到各个行业、各个场景。在 2021.7.10 的 Imagine 阿里云视频云全景创新峰会上,艾瑞研究院副总经理徐樊磊,带来了主题演讲《云上视频新场景洞察》,从视频云产业链的供给与需求切入,深入行业与市场,探索云上新场景和新兴场域的想象空间,并将视线放远,瞭望视频云未来的技术极致化和全新体验。以下内容为演讲整理。
新时代大视频产业的底座,视频云创变了什么?
下一篇
无影云桌面