商业破圈背后,3D虚拟人的真风口时代到了

简介: 近年来包括ChatGPT、虚拟人等在内的一系列技术的爆发,让整个产业界重新燃起了对新技术革命的信心。

近年来包括ChatGPT、虚拟人等在内的一系列技术的爆发,让整个产业界重新燃起了对新技术革命的信心。面对扑面而来的“超级风口”,很多企业的心态却是“愈加复杂”:一方面风口带来的产业机遇人人向往;而另一方面,很多言过其实的“科技”一再被证伪,谁也不愿意去做那个“风口上的猪”,这种心理也反映在人们对待虚拟人行业的态度上。

在很多人看来,今天的虚拟人就如同当年的互联网一样,仍只是停留在“工具”范畴,尚不具备颠覆产业的磅礴伟力。但从内外各种新条件来看,当下虚拟人的产业化和商业化,正在进入新的历史阶段。

虚拟人商业价值日渐凸显

近年来,元宇宙概念风靡世界,形形色色的虚拟人也不断进入人们的视野。早在2021年,虚拟美妆达人柳夜熙在抖音上发布了第一支短视频,迅速获超300万赞,引发持续关注;而在2022年江苏卫视的跨年晚会上,以邓丽君为原型的虚拟人与现场歌手周深合唱《小城故事》、《漫步人生路》等歌曲,实现了跨时空的同台合唱;北京冬奥会期间,央视新闻联合百度智能云推出的AI手语虚拟主播,准确及时地进行赛事直播,成为听障群体“智”听新闻的伙伴。而在虚拟人被越来越广泛地应用于更多领域的背后,与虚拟人行业本身成熟度和消费者认可度的提升不无关系。

首先,从技术层面来看,虚拟人产业化的条件已经成熟。目前虚拟人的主流技术驱动路线,主要可以分为人工智能驱动和动作捕捉驱动,目前这两种技术路线分别对应不同的应用场景。比如,人工智能驱动型虚拟人,主要应用于新闻播报、客服、讲解等场景,动作捕捉型虚拟人,则适合于MCN机构营销、直播、虚拟主播等互动性强的场景。

另外,目前虚拟人产业链也已经开始走向成熟,并形成了由上游制作、渲染工具,中游的虚拟人驱动与运营,下游的场景应用一起组成的完整虚拟人产业链生态图谱。如今在虚拟技术、大数据、人工智能等技术的加持下,虚拟数字人不断进化,形象越来越逼真,应用的范围越来越广,商业价值持续提升。

其次,用户对虚拟人的接受度和认可度逐渐提升。根据营销机构“网红营销工厂”针对美国消费者的一项调查,有超过一半的消费者在社交媒体上关注至少一位虚拟网红,有35%的消费者购买过虚拟网红推销的产品。艾媒咨询数据显示,2022年中国网民对虚拟人了解和关注程度提高,关注度从2021年的63.6%上升至2022年的87.8%。可见,随着虚拟人技术的成熟,正有越来越多的人认可虚拟人的商业价值。

“真”虚拟人正在变成现实

事实上,在外界高度认可的情况下,有一批更加大胆的厂商,正在为推动虚拟人走向更加宽广的应用领域而努力。比如由MMC工作室制作的超写实虚拟人——李星澜,已经不再是简单的游戏NPC,而是一个真正的虚拟数字人了。它除了能够在游戏中引导玩家,还能够在游戏之外,发抖音、接代言、做主持人、领奖看秀更是不在话下。在李星澜身上,人设灵魂、外形皮囊和AI内核实现了完美统一,这让它与以往的所谓“数字人”完全不同。

而MMC工作室,绝对不是业内第一个想要这么做的公司。作为虚拟人领域的“佼佼者”,魔珐科技在最近的发布会上,提出了“3D虚拟人”的概念,并将其明确化为三个特征即具备3D形象、能够互动表达、具备专业化能力。这里面每一个要求都对着两个事情:一是技术实力;另一个是应用场景。

从技术层面来说,这样的虚拟人已经实现了完全的AI驱动,并且在动作捕捉等多重技术的加持下,其形象、动作已经无限贴近人的实际生活。从行业来看,过去行业内的所谓“虚拟人”,要么就是有形象但是由手工制作的特效人物或者虚拟偶像;另一类则是由AIGC驱动但无形象的AI助手,大众最熟悉的要数ChatGPT了。而按照魔珐科技的定义,3D虚拟人需要“既有形象,又由AIGC生成”,这使其能力与以往的虚拟人已不可同日而语了。

一来,它从技术上实现了突破,可以实现大规模复制,具备了产业化的基本条件。二来,它的智能交互无限接近于人类的水平,整体的体验与以往唇形技术支持的虚拟人完全不同,它实现了完全的“形神兼备”。这些变化或从底层重塑虚拟人产业,并对各行业产生全新的影响。

从应用场景上来看,3D虚拟人具备了跨终端的应用能力,能够在更加宽广的范围内服务好大众。3D虚拟人可以通过现有的手机、电脑等各种终端,并且7*24小时不间断在线给用户提供服务,我们可以随时体验到真人一样的面对面服务,这意味着3D虚拟人真正将“虚拟人”的适用范围,从部分行业拓展到了更宽广的领域,虚拟人行业或将因此迎来剧变。

Vision Pro成全新催化剂

值得注意的是,苹果最新发布的Vision Pro,推出了3D版的FaceTime功能和3D视频功能,这意味着虚拟人应用将在这款号称“革命性的产品”中得到应用,这或将会给行业的发展带来全新催化剂。

首先,3D视频功能的实现,使得原先的视频生成方式发生改变,由此给人们的生活带来全新的改变。过去2D视频通话时代,人们的聊天尚未突破现实与虚拟的壁垒,然而到了3D视频时代,人们则可以通过3D视频通话,体验到彼此面对面交谈的乐趣。其本质是通过高分辨率传感器、数十个景深扫描传感器以及其他显示器,实时生成3D模型。然后通过光场技术将三维内容直接立体展现在平面屏幕上,让用户感受沉浸式体验。

由于该技术的实现,3D视频可以进一步被应用于更多场景之中。比如,用户可以用3D视频记录自己与家人、朋友相处的影像,思念朋友的时候可以重新借助3D影像,身临其境地感受到彼此相处的点点滴滴。在工业领域,工厂设备的调试可能不再需要专家来回跑一次又一次,只需要他将自己调试的过程上传到头显设备中,工厂这边就可以自行进行调试工作,而且工人还可以通过3D影像完整地看到整个过程。除此之外,它还可以应用于教育领域,使“言传身教”真正变成现实。

用3D视频去记录一个人的动作、声音和行为,再把足够多的3D视频给到AI训练,可能就会得到一个3D版的虚拟人,让离开的人也可以重新以数字体的形式存在,与我们交流、表达。

其次,3D Face Time虚拟人将虚拟与现实世界再次打开,将人们的视听体验继续拉升到一个全新的高度。比如,用户可以借助头显设备走进入MR设备中的虚拟世界,如用户可以以虚拟人的方式走进恐龙世界,近距离感受恐龙,甚至可以触摸恐龙,看到恐龙的牙齿等等,这是苹果赋予vision Pro的功能应用。

诸如此类的3D影像带来的超沉浸式体验,必然会给整个虚拟人行业带来全新的机遇。考虑到空间计算中,三维虚拟人将会作为交互媒介,扮演像移动互联网中“ID”一样的角色,其实际作用还会更大。而且由于虚拟人具有外在形象和内在智能,往往具有更多的功能效用,这意味着在苹果开创的这个新时代,虚拟人将扮演更重要的角色。

虚拟人的“大航海时代”到了?

以虚拟人自身蕴含的巨大潜力来看,当下围绕3D虚拟人的应用只是开始,未来伴随着虚拟现实、人工智能、5G应用、云等诸多技术的发展,虚拟人或许已经走到了一个逼近产业化的全新时代。

首先,随着虚拟人的应用领域不断扩大、商业模式不断丰富,产业“造血能力”不断增强,整个行业正在进入高质量发展阶段。根据类型的不同,虚拟人的制作成本从几十万到几百万不等,制作周期从15天到3~4个月不等,超写实的虚拟人的制作费用相对较高,可能高达上百万。不过随着超写实虚拟人在AIGC加持之下,可以快速生成IP形象和解放模特的服饰、表情和动作,为创作者带来极大的便利。以往需要耗费大量时间和精力来设计和塑造角色形象的过程,现在可以通过AIGC虚拟人的帮助迅速实现,极大地节省了创作者的时间和成本。

在收入端,虚拟人厂商通过建模和渲染等技术,收取虚拟数字人及其相关场景的一次性制作费用;通过动作捕捉、面部捕捉和人工智能技术,实现技术授权使用费;通过打造聚合技术平台,收取平台使用费等,已经成为虚拟人行业经过验证确实可行的商业模式。总体来看,无论是成本端的下降还是收入渠道的增多,都意味着虚拟人的商业化通道逐渐打通,过去困扰行业的“商业化不足”难题,正在逐渐得到解决。

其次,随着虚拟人数字资产价值的凸显,正有越来越多的新玩家,以及行业企业推动虚拟人在产业的落地,其想象空间正在持续放大。从最早的传媒、游戏,再到后来的金融、体育、教育,再到如今逐渐进入工业领域,虚拟人的行业版图正在持续扩大。在供应端,除了早期的初创企业之外,包括阿里、腾讯、字节跳动、百度等行业头部企业,都已经开始纷纷发力该领域,推动虚拟人行业的持续进步,由于其总体实力更强,因而其对虚拟人产业供给端的改善也将会更大。

而随着虚拟人在供给、需求、商用等各环节环境的持续改善,虚拟人行业也将迎来空前的红利。对于参与其中的玩家而言,一场全新的技术浪潮或已经来临。

目录
相关文章
|
SQL 存储 监控
|
JavaScript
Layui数据表格嵌套文件上传按钮
Layui数据表格嵌套文件上传按钮
363 0
Python错误 TypeError: ‘NoneType‘ object is not subscriptable解决方案汇总
Python错误 TypeError: ‘NoneType‘ object is not subscriptable解决方案汇总
[go 面试] 雪花算法与分布式ID生成
[go 面试] 雪花算法与分布式ID生成
|
机器学习/深度学习 数据采集 算法
时间序列结构变化分析:Python实现时间序列变化点检测
在时间序列分析和预测中,准确检测结构变化至关重要。新出现的分布模式往往会导致历史数据失去代表性,进而影响基于这些数据训练的模型的有效性。
1284 1
|
8月前
|
编解码 定位技术 vr&ar
NETALAND惊艳上线,Paraverse平行云助力元宇宙大玩家网易闪亮登场
网易传媒旗下全新泛娱乐空间NETALAND于2023年5月上线,融合电影级场景与趣味互动,提供沉浸式元宇宙体验。通过与平行云合作,NETALAND实现了轻量化社交、全地图飞行及丰富的定制化功能,支持用户在五大风格场景中自由探索。LarkXR实时云渲染技术确保了流畅的交互体验,并助力采集宝贵的用户行为数据,推动元宇宙内容创新。
239 14
|
Prometheus 监控 关系型数据库
数据库同步革命:MySQL GTID模式下主从配置的全面解析
数据库同步革命:MySQL GTID模式下主从配置的全面解析
1243 0
|
Java Linux 开发工具
eft搭建详细步骤!
1、安装vmware 2、下载合适版本的centos并安装 稍后安装操作系统(安装第二个时把安装程序光盘映像文件ISO清空) 自定义硬件-内存4G-处理器2X2-网络适配器NAT-CD/DVD使用ISO映像 网络和主机名:主机名设置、开启以太网(安装好使用ip addr查看ip地址1-9-2开头的) root密码设置 3、安装xshell 使用ip addr看ip然后连接上 4、安装jdk yum search java|grep jdk yum install -y java-1.8.0-openjdk*
243 2
|
机器学习/深度学习 算法 atlas
RAG 2.0架构详解:构建端到端检索增强生成系统
RAG(检索增强生成)旨在通过提供额外上下文帮助大型语言模型(LLM)生成更精准的回答。现有的RAG系统由独立组件构成,效率不高。RAG 2.0提出了一种预训练、微调和对齐所有组件的集成方法,通过双重反向传播最大化性能。文章探讨了不同的检索策略,如TF-IDF、BM25和密集检索,并介绍了如SPLADE、DRAGON等先进算法。目前的挑战包括创建可训练的检索器和优化检索-生成流程。研究表明,端到端训练的RAG可能提供最佳性能,但资源需求高。未来研究需关注检索器的上下文化和与LLM的协同优化。
1685 1