带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(1)

简介: 带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究

虚拟数字人行业现状和技术研究

作者:金擘(渚薰)

出品:大淘宝技术


本文为金擘(渚薰) 在第十六届D2前端技术论坛上的分享,为你讲述当前业界的现状,包括不同行业中的showcase 和优秀的技术/创作平台,引出近几年比较火热的数字人,包含多个核心技术点,同时畅想数字人在未来的技术增长 和业务价值,以及当下我们该如何布局。


我们理解的数字人


近几年数字人的概念在互联网中异常火热,业界也出现了很多热门虚拟数字人或虚拟偶像,比如Lil Miquela,洛天 依、初音、鹿鸣、暖暖、AYAYI等。这些数字人的商业模式或市场价值通常是:通过运营积攒流量,依靠流量变 现。例如:品牌代言(IP、事件)、粉丝经济(二次元)、虚拟主播(游戏、带货)。


本文为接下来讲到的数字人,定义了三个核心要素:

1. 形:具备人或拟人的外观,具有特定的相貌等人物特征。

2. 动:拥有和人相似的行为,具有用语言、表情和肢体等表达的能力。

3. 神:拥有比拟人的思想,具有识别外界环境、并能与人交流互动的能力。 这三条要素对于虚拟数字人的“完成度”来说是一个递进的关系。


市场现状


近几年,虚拟数字人在电商、金融、影视、游戏和金融等行业都拥有不同大小的市场规模。例如:虚拟偶像行业 2020年中国的市场规模为34.6亿元,预计2021年将达到62.2亿元。


image.png

市场规模增长,也印证了技术的发展:制作成本逐年降低、形象外貌更加真实、语言交流更加自然。从出现虚拟数 字人至今,已经渡过了3个重要的时期:


1. 初创期:市场初见增长,技术不确定性,入行门槛高。

2. 发展期:市场竞争者增多,技术逐渐成型,入行门槛低。

3. 平台期:市场红海到来,平台化成熟,领头羊 + 小众。


解决方案


在如今的平台时期中,各个厂商也聚集在一起提供不同层次的解决方案:


image.png


1.基础层:为虚拟数字人提供基础软硬件支撑,硬件包括显示设备、光学器件、传感器、芯片等,基础软件包括建 模软件、渲染引擎。仅有少数几个顶尖科技公司才具备优秀的软硬件实力。

2.平台层:包括**软硬件系统、生产技术服务平台、AI 能力平台,**为虚拟形象的制作及开发提供技术能力。提供 平台服务的企业非常多,通过出售服务和技术来服务其他企业。

3.应用层:除了最终的企业用户,一些具备出色营销和运营能力的公司或团队也为这个行业带来了不错的想法和创意。


我们在做什么


在今年年初,在阿里巴巴前端委员会的互动图形方向中成立了虚拟角色小组,这个小组有这几只团队组成:大淘宝 互动团队、达摩院智慧数字人团队、优酷数字人制播团队、考拉互动&内容导购团队、蚂蚁数字与金融内容社区团 队。他们一起分享和研究虚拟数字人领域的技术和应用。业务涉及游戏、视频、直播三个主要的场景。


image.png


1.游戏:虚拟数字人在游戏行业基本是标配,非常多的游戏都会需要塑造人物,其中能让玩家通过自定义塑造人物 形象功能的这一类游戏,自定义塑造人物形象的功能也称为“捏人”。

淘宝人生:这是手淘App内一款可以打造虚拟形象的游戏,包含了捏脸、穿搭、美颜、拍照等功能,逛街、家园 等玩法。

养考拉:这是考拉海购App内的一款可以养成考拉的游戏,包含了装扮功能,喂养等玩法。

它们均采用Web为主的技术方案,通过自研的引擎完成渲染、表情、动作等人物的形和行。

2.视频:虚拟数字人的短视频可以给用户带来感官上的优秀体验,还能给业务带来增量的收益。在制作虚拟数字人 的视频时,可以通过动作捕捉、智能识别、导演系统等方案,让虚拟数字人栩栩如生。

3.直播:直播和虚拟数字人的结合仍然处于早期的探索阶段,因为两种现象级的产业需要结合且形成新的或增量的 商业模式并不容易。这其中涉及到的技术也有实时动作捕捉、算法训练合成、在直播场景下的云渲染推流等等。


我们一起来创作


随着应用场景专业和深入,技术研究也会涵盖工程和算法等多种综合性的解决方案,且在不同的应用场景下,侧重 点也会不太一样。接下来以大淘宝互动团队的淘宝人生业务为例子,分别从美术生产、渲染风格、捏脸换装、表情 动作、导演系统和语音合成六大主题为大家呈现如何打造超级虚拟偶像。



这个章节我们来完成虚拟数字人的形 - “具备人或拟人的外观,具有特定的相貌等人物特征”。


image.png


带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(2)

https://developer.aliyun.com/article/1262086?groupCode=taobaotech

相关文章
|
7月前
|
传感器 人工智能 搜索推荐
|
1月前
|
API 语音技术 开发者
基于开源技术的数字人实时对话:形象可自定义,支持语音输入,对话首包延迟可低至3s
魔搭社区最近上线了基于开源技术的数字人实时对话demo,无需预训练即可使用自定义的数字人形象进行实时对话,支持语音输入和实时对话。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】python之人工智能应用篇--数字人生成技术
数字人生成技术是基于人工智能技术和计算机图形学技术创建的虚拟人物形象的技术。该技术能够模拟人类的外貌、声音、动作和交流能力,为多个领域带来创新的应用可能性。数字人的本质是将所有信息(数字和文字)通过数字处理(如计算机视觉、语音识别等)再进行表达的过程,形成具有人类形态和行为的数字产物。 数字人的生成涉及到多种技术,如3D重建技术,使用三维扫描仪扫描人的外观、五官等,并通过3D模型重建三维人;虚拟直播技术,使用计算机技术生成人物或实体,并且可以实时直播、录制;数字人体数据集技术,利用数据构建数字人模型以及训练虚拟现实引擎等
143 4
|
5月前
|
新零售 人工智能 vr&ar
国家发展改革委等部门:鼓励利用数字人等技术拓展电商直播场景!
国家发改委推出措施鼓励创新消费场景,特别提到利用AI、VR等技术增强购物体验,支持数字人电商。青否数字人直播系统提供独立部署方案,适应抖音直播并解决封号问题,具备实时话术改写和AI智能回复功能,确保互动合规。此系统适用于24小时直播,降低商家成本,提升效率。欲了解更多信息,可访问:zhibo175。
国家发展改革委等部门:鼓励利用数字人等技术拓展电商直播场景!
|
6月前
|
算法
VASA-1:实时音频驱动的数字人说话面部视频生成技术
【6月更文挑战第8天】VASA-1是实时音频驱动的数字人面部视频生成技术,能根据输入音频精准生成匹配的面部表情。具备实时性、高准确性和适应性,适用于虚拟主播、在线教育和影视娱乐等领域。简单示例代码展示了其工作原理。尽管面临情感理解和硬件优化等挑战,但随着技术发展,VASA-1有望在更多领域广泛应用,开启生动数字世界的新篇章。
309 5
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
664 0
|
对象存储 流计算 CDN
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(2)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
190 0
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(3)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
174 0
|
机器学习/深度学习 达摩院 前端开发
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(4)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
168 0
|
数据采集 前端开发 大数据
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(5)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
239 0

热门文章

最新文章

下一篇
DataWorks