阿里云视频云,用技术普惠打造平民化“虚拟人”

简介: 近日,国内首个超写实数字人 AYAYI 宣布入职阿里,成为天猫超级品牌日的数字主理人,二者将共同开启元宇宙的营销世界。在未来她将与天猫解锁多个身份,如 NFT 艺术家、数字策展人、潮牌主理人、顶流数字人等等。

近日,国内首个超写实数字人 AYAYI 宣布入职阿里,成为天猫超级品牌日的数字主理人,二者将共同开启元宇宙的营销世界。在未来她将与天猫解锁多个身份,如 NFT 艺术家、数字策展人、潮牌主理人、顶流数字人等等。

1.png

提到虚拟数字人,大家第一时间想到就是 2012 年诞生的洛天依。她的出现补了国内空白的虚拟偶像市场。虽然她最初只拥有声音与立绘,但九年来,粉丝们不断为她写歌作曲、绘制插画、制作 MMD,这些同人创作,一点点填充着最初的空白。相比于真人养成偶像,依托于 UGC 内容长大的虚拟偶像,更像是一场纯粹的养成式造星。而在 2021 年初以洛天依为代表的、次元特征的虚拟偶像开始在春晚大放光彩,这意味着国家级平台对次元文化的尊重与认可,也是虚拟与现实产生的一次有益互动。

2.png
洛天依亮相春晚节目少儿歌舞《听我说》

iiMedia Research (艾媒咨询) 数据显示,2020 年中国虚拟偶像核心产业规模为 34.6 亿元,同比增长 70.3%,预计 2021 年将达到 62.2 亿元;另一方面,随着商业价值被不断发掘,越来越多产业与虚拟偶像联系在一起,虚拟偶像带动产业规模 2020 年为 645.6 亿元,预计 2021 年为 1074.9 亿元。
而在国外的短视频平台上,虚拟数字人也是大行其道。一位名叫 Lil Miquela 的虚拟偶像,其人设是一个 19 岁混血女孩,有着可爱雀斑,长期定居在洛杉矶,拥有西班牙裔、巴西裔和美国血统的虚拟模特及音乐人。据央视网 2021 年 01 月 30 日的报道,Lil Miquela 在 2019 年的收入折合人民币大约为 7600 万。

什么是虚拟数字人?

“虚拟数字人”一词最早源于 1989 年美国国立医学图书馆发起的“可视人计划”(Visible Human Project, YHP)。2001 年, 国内以“中国数字化虚拟人体的科技问题”为主题的香山 科学会议第 174 次学术讨论会提出了“数字化虚拟人体”的概 念。这些“虚拟数字人”主要是指人体结构的可视化,以三维形式显示人体解剖结构的大小、形状、位置及器官间的相互空间关系,即利用人体信息,实现人体解剖结构的数字化。主要应用于医疗领域的人体解剖教学、临床诊疗等。

不同于上述医疗领域的数字化人体,目前网络上围绕元宇宙所讨论的虚拟数字人(以下简称“数字人”)是指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在。虚拟数字人宜具备以下三方面特征:一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;三 是拥有人的思想,具有识别外界环境、并能与人交流互动的能力。

近年来,得益于深度学习算法的突破,数字人的制作过程变成更加简单,虚拟数字人开始进入大众的视野,应用在各行各业,例如已经出现了娱乐型数字人(如虚拟主播、 虚拟偶像)、教育型数字人(如虚拟教师)、助手型数字人 (如虚拟客服、虚拟导游、智能助手)、影视数字人(如替 身演员或虚拟演员)等。不同外形、不同功能的虚拟数字人赋能影视、传媒、游戏、金融、文旅等领域,根据需求为用户提供定制化服务。

3.png
虚拟数字人产业视图 资料来源:《2020 年虚拟数字人发展白皮书 》

在实现技术方面,虚拟数字人系统一般情况下由人物形象、语音生成、动画生成、音视频 合成显示、交互等 5 个模块构成。其中最为基础的是人物形象技术,根据人物图形资源的维度,可分为 2D 和 3D 两大类,从外形上又可分为卡通、拟人、写实、超写实等风格。

4.png
资料来源:《2020 年虚拟数字人发展白皮书 》

阿里云卡通智绘:打造身边的虚拟偶像

因为虚拟人的人物形象构建方面具有一定的技术门槛,所以对普通人来说,虚拟人似乎仍停留在偶像阶段,只能“远观”。但来自阿里云视频云的团队却通过优化的算法技术,让普通人也能有机会创造属于自己的卡通形象,在虚拟世界里塑造“平民偶像”,在2021年的云栖大会开发者展区,阿里云就展示了最新技术——卡通智绘项目,吸引了近2000名体验者,成为了大会爆款。这项技术采用了隐变量映射的人脸风格化技术方案,通过机器学习算法可以把拍摄者本来的面目特征和目标训练风格做深度融合,重建面部的形状,它既符合用户脸部特征,又具有卡通的风格化,还可以跟踪用户的面部姿态和丰富的表情生成实时动画。

5.png
而这所有的技术全靠 AI 完成,对使用者而言只需通过上传一张自拍照就能自动生成符合用户人脸特点的虚拟人。
20211104161254.jpg

阿里云卡通智绘可以对输入人像图片,发掘其显著特征(如眼睛大小,鼻型等),自动化生成具有个人特色的虚拟形象(即风格化后的效果)。所谓人脸风格化,就是将真实的人脸头像转换为特定的风格头像,最常见的包括卡通风格、动漫风格、油画风格,如下图所示:

20211104161230.jpg
阿里云视频云卡通智绘效果图

得益于 AI 技术的高速发展,虚拟人已经不再是触不可及的事物,在可预见的未来,由卡通智绘创建虚拟人将作为虚拟主播、虚拟老师、虚拟客服、虚拟导游的数字化身,越来越频繁的出现在各行各业。

参考资料:中国人工智能产业发展联盟总体组和中关村数智人工智能产业联盟数字人工作委员,《2020 年虚拟数字人发展白皮书 》

扫码入群和作者一起探讨音视频技术
获取更多视频云行业最新信息👇

image.png

「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。
相关文章
|
3月前
|
人工智能 自然语言处理 搜索推荐
2025年12月,中国数字人平台介绍与技术图谱及链路突破
2025年,数字人迈向规模化落地。本文从算力、建模、交互、场景、闭环五大维度,深度解析头部企业技术路径,揭示行业标杆与选型逻辑,助力组织实现战略卡位。
|
8月前
|
机器学习/深度学习 达摩院 PyTorch
GitHub 1.3k 一款能“填色回忆”的神器:DDColor 让老照片鲜活又逼真
DDColor 是阿里达摩院推出的图像自动着色模型,采用双解码器架构与 Colorfulness Loss 技术,实现黑白图到高保真彩色图的智能转换。支持 GPU/CPU 推理,兼容历史照片、动画、游戏截图等多场景,具备高效、真实、多样、易用等特点,广泛适用于影像修复、艺术创作等领域。
953 24
|
存储 监控 物联网
计算机网络的应用
计算机网络已深入现代生活的多个方面,包括通信与交流(电子邮件、即时通讯、社交媒体)、媒体与娱乐(在线媒体、在线游戏)、商务与经济(电子商务、远程办公)、教育与学习(在线教育平台)、物联网与智能家居、远程服务(远程医疗、智能交通系统)及数据存储与处理(云计算、数据共享与分析)。这些应用极大地方便了人们的生活,促进了社会的发展。
904 2
计算机网络的应用
|
人工智能 自然语言处理 前端开发
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
Lobe Vidol是一款开源的AI数字人交互平台,允许用户创建和互动自己的虚拟偶像。该平台提供流畅的对话体验、丰富的动作姿势库、优雅的用户界面设计以及多种技术支持,如文本到语音和语音到文本技术。Lobe Vidol适用于娱乐互动、在线教育、客户服务、品牌营销和社交媒体等多个应用场景。
923 7
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
|
存储 监控 网络协议
一次读懂网络分层:应用层到物理层全解析
网络模型分为五层结构,从应用层到物理层逐层解析。应用层提供HTTP、SMTP、DNS等常见协议;传输层通过TCP和UDP确保数据可靠或高效传输;网络层利用IP和路由器实现跨网数据包路由;数据链路层通过MAC地址管理局域网设备;物理层负责比特流的物理传输。各层协同工作,使网络通信得以实现。
|
存储 人工智能 自然语言处理
效率翻倍!2024免费AI流程图生成工具评测
2分钟了解有哪些好用的AI流程图生成工具。
3407 4
效率翻倍!2024免费AI流程图生成工具评测
|
存储 分布式计算 安全
大数据存储与管理(一)|学习笔记
快速学习大数据存储与管理(一)
1622 0
大数据存储与管理(一)|学习笔记
|
存储 NoSQL 大数据
大数据中数据存储 (Data Storage)
【10月更文挑战第17天】
2019 2
|
人工智能 安全 测试技术
MetaLlama大模型
LLaMA 是一组基础语言模型,参数范围从 7B 到 65B,在大量公开数据上训练而成,性能优异。Llama 2 为 LLaMA 的升级版,参数规模扩大至 70 亿至 700 亿,特别优化了对话功能。Code Llama 基于 Llama 2 开发,专注于代码生成,提供不同参数规模的模型。这些模型可在多种平台上运行,包括官方 API、第三方封装库如 llama.cpp 和 ollama,以及通过 Hugging Face 的 transformers 库使用。此外,还提供了详细的模型申请及使用指南,便于开发者快速上手。相关链接包括 Meta 官方页面和 GitHub 仓库。
MetaLlama大模型

热门文章

最新文章