阿里云视频云，用技术普惠打造平民化“虚拟人”-阿里云开发者社区

阿里云视频云，用技术普惠打造平民化“虚拟人”

2021-11-04 928

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 近日，国内首个超写实数字人 AYAYI 宣布入职阿里，成为天猫超级品牌日的数字主理人，二者将共同开启元宇宙的营销世界。在未来她将与天猫解锁多个身份，如 NFT 艺术家、数字策展人、潮牌主理人、顶流数字人等等。

近日，国内首个超写实数字人 AYAYI 宣布入职阿里，成为天猫超级品牌日的数字主理人，二者将共同开启元宇宙的营销世界。在未来她将与天猫解锁多个身份，如 NFT 艺术家、数字策展人、潮牌主理人、顶流数字人等等。

提到虚拟数字人，大家第一时间想到就是 2012 年诞生的洛天依。她的出现补了国内空白的虚拟偶像市场。虽然她最初只拥有声音与立绘，但九年来，粉丝们不断为她写歌作曲、绘制插画、制作 MMD，这些同人创作，一点点填充着最初的空白。相比于真人养成偶像，依托于 UGC 内容长大的虚拟偶像，更像是一场纯粹的养成式造星。而在 2021 年初以洛天依为代表的、次元特征的虚拟偶像开始在春晚大放光彩，这意味着国家级平台对次元文化的尊重与认可，也是虚拟与现实产生的一次有益互动。

洛天依亮相春晚节目少儿歌舞《听我说》

iiMedia Research (艾媒咨询) 数据显示，2020 年中国虚拟偶像核心产业规模为 34.6 亿元，同比增长 70.3%，预计 2021 年将达到 62.2 亿元；另一方面，随着商业价值被不断发掘，越来越多产业与虚拟偶像联系在一起，虚拟偶像带动产业规模 2020 年为 645.6 亿元，预计 2021 年为 1074.9 亿元。
而在国外的短视频平台上，虚拟数字人也是大行其道。一位名叫 Lil Miquela 的虚拟偶像，其人设是一个 19 岁混血女孩，有着可爱雀斑，长期定居在洛杉矶，拥有西班牙裔、巴西裔和美国血统的虚拟模特及音乐人。据央视网 2021 年 01 月 30 日的报道，Lil Miquela 在 2019 年的收入折合人民币大约为 7600 万。

什么是虚拟数字人？

“虚拟数字人”一词最早源于 1989 年美国国立医学图书馆发起的“可视人计划”(Visible Human Project, YHP)。2001 年, 国内以“中国数字化虚拟人体的科技问题”为主题的香山科学会议第 174 次学术讨论会提出了“数字化虚拟人体”的概念。这些“虚拟数字人”主要是指人体结构的可视化，以三维形式显示人体解剖结构的大小、形状、位置及器官间的相互空间关系，即利用人体信息，实现人体解剖结构的数字化。主要应用于医疗领域的人体解剖教学、临床诊疗等。

不同于上述医疗领域的数字化人体，目前网络上围绕元宇宙所讨论的虚拟数字人(以下简称“数字人”)是指具有数字化外形的虚拟人物。与具备实体的机器人不同，虚拟数字人依赖显示设备存在。虚拟数字人宜具备以下三方面特征:一是拥有人的外观，具有特定的相貌、性别和性格等人物特征;二是拥有人的行为，具有用语言、面部表情和肢体动作表达的能力;三是拥有人的思想，具有识别外界环境、并能与人交流互动的能力。

近年来，得益于深度学习算法的突破，数字人的制作过程变成更加简单，虚拟数字人开始进入大众的视野，应用在各行各业，例如已经出现了娱乐型数字人(如虚拟主播、虚拟偶像)、教育型数字人(如虚拟教师)、助手型数字人 (如虚拟客服、虚拟导游、智能助手)、影视数字人(如替身演员或虚拟演员)等。不同外形、不同功能的虚拟数字人赋能影视、传媒、游戏、金融、文旅等领域，根据需求为用户提供定制化服务。

虚拟数字人产业视图资料来源：《2020 年虚拟数字人发展白皮书》

在实现技术方面，虚拟数字人系统一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互等 5 个模块构成。其中最为基础的是人物形象技术，根据人物图形资源的维度，可分为 2D 和 3D 两大类，从外形上又可分为卡通、拟人、写实、超写实等风格。

资料来源：《2020 年虚拟数字人发展白皮书》

阿里云卡通智绘：打造身边的虚拟偶像

因为虚拟人的人物形象构建方面具有一定的技术门槛，所以对普通人来说，虚拟人似乎仍停留在偶像阶段，只能“远观”。但来自阿里云视频云的团队却通过优化的算法技术，让普通人也能有机会创造属于自己的卡通形象，在虚拟世界里塑造“平民偶像”，在2021年的云栖大会开发者展区，阿里云就展示了最新技术——卡通智绘项目，吸引了近2000名体验者，成为了大会爆款。这项技术采用了隐变量映射的人脸风格化技术方案，通过机器学习算法可以把拍摄者本来的面目特征和目标训练风格做深度融合，重建面部的形状，它既符合用户脸部特征，又具有卡通的风格化，还可以跟踪用户的面部姿态和丰富的表情生成实时动画。

而这所有的技术全靠 AI 完成，对使用者而言只需通过上传一张自拍照就能自动生成符合用户人脸特点的虚拟人。

阿里云卡通智绘可以对输入人像图片，发掘其显著特征（如眼睛大小，鼻型等），自动化生成具有个人特色的虚拟形象（即风格化后的效果）。所谓人脸风格化，就是将真实的人脸头像转换为特定的风格头像，最常见的包括卡通风格、动漫风格、油画风格，如下图所示：

阿里云视频云卡通智绘效果图

得益于 AI 技术的高速发展，虚拟人已经不再是触不可及的事物，在可预见的未来，由卡通智绘创建虚拟人将作为虚拟主播、虚拟老师、虚拟客服、虚拟导游的数字化身，越来越频繁的出现在各行各业。

参考资料：中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员，《2020 年虚拟数字人发展白皮书》

扫码入群和作者一起探讨音视频技术
获取更多视频云行业最新信息👇

「视频云技术」你最值得关注的音视频技术公众号，每周推送来自阿里云一线的实践技术文章，在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群，和业内大咖一起探讨音视频技术，获取更多行业最新信息。

阿里云视频云，用技术普惠打造平民化“虚拟人”

什么是虚拟数字人？

阿里云卡通智绘：打造身边的虚拟偶像

参考资料：中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员，《2020 年虚拟数字人发展白皮书》