开发者社区> -开发者助手-> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

Web3.0时代 | 数字人如何突破规模落地三大难点? 百度李士岩:两年内每个人有望实现“数字人自由”

简介: Web3.0时代 | 数字人如何突破规模落地三大难点? 百度李士岩:两年内每个人有望实现“数字人自由”
+关注继续查看

刚刚过去的 2021 年,元宇宙概念爆火到一度“出圈”成了顶流。在全球科技巨头纷纷下场、web 3.0 加速构建的过程中,虚拟数字人作为元宇宙的场景入口与连接纽带也备受瞩目。刚刚举办的江苏卫视跨年晚会上,周深与邓丽君跨时空合唱《大鱼》在全网刷屏。面对数字人展现出的众多可能性,2022 年 1 月 14 日,百度科技沙龙《AI 呀,我去!》第四期以数字人为主题,为百余位媒体、专家学者展现了数字人产业的全景。

image.png

本次活动上,百度智能云 AI 人机交互实验室负责人李士岩基于多年经验,围绕当前数字人产业的发展格局、技术难点和底层驱动力进行了系统分享。李士岩表示,虚拟数字人产业格局中,提供建模、渲染、动态捕捉等服务于数字人制作的基础设施服务商已形成稳固格局,大多由海外巨头把持,但在工具、应用层,中国企业已开始崭露头角。

尽管如此,数字人规模化落地还面临三大难点:产业链割裂、服务场景与演艺场景没有有效打通、满足高频需求成本高。为系统解决这些难题,百度推出数字人平台“曦灵”,未来数字人生产、内容创作、业务配置服务将可以在一个平台上实现全链路制作和调优,降本增效。“我们近两年的奋斗目标是,通过百度智能云曦灵平台的开放,让每个人实现数字人自由。”李士岩表示。

数字人大规模落地要突破三大难题

目前,数字人经历了以“纸片人”为代表的 1.0 阶段,以 Vtuber 主播为代表的 2.0 时代,已进化至3.0阶段,具备模型高精、人工智能驱动特点的数字人 3.0 成为行业主流。李士岩介绍,第三代数字人的建模和内容生产均有 AI 参与,这使得数字人的制作效率更高,也更智能,能面向更多应用场景。可面向全群体用户,可由视频、直播、chatbot 等载体承载,更具备千人千面的互动能力。

image.png

现阶段,数字人 3.0 已展现出巨大的市场空间。根据次元光谱不完全统计,2021 年国内虚拟偶像/数字人领域里至少发生 19 笔融资,2021 年产业上下游也纷纷从自己擅长的角度切入市场。虚拟数字人产业格局中,提供建模、渲染、动态捕捉等服务于数字人制作的基础设施服务商已形成稳固格局,大多由海外巨头把持。不过,在工具、应用层,中国企业已开始崭露头角。

中国企业中,数量最多的是资产制作和策划运营类的公司,比如推出超写实数字人的 AYAYI 燃麦科技,推出虚拟人物柳夜熙的创壹视频,但这类公司面临的挑战是门槛较低、可替代性高。此外,掌握技术和场景的互联网公司则扮演综合性技术服务商的角色,一边推出基于自身优势场景的数字人,打造应用标杆;一边推出数字人平台,将产品继续落地到更细化的场景中,点、线互相推进。

image.png

李士岩表示,数字人产业有三大核心推动力,第一级火箭是用户需求与技术升级、第二级是政策支持与资本涌入、第三级是计算平台的迭代 —— “每一次数字人发展本质上都是技术推动的,用户从平面的图文影音获取信息与交互,向实时 3D 交互反馈的需求转变,将成为数字人长期发展的根本动能,未来也将创造大量需求。“

虽然数字人行业拥有强劲的驱动力,但李士岩认为,当下国内数字人要大规模产业落地还面临三大难题。

首先,数字人产业链各个节点相对割裂,不能高效协同,导致数字人在制作和调优上存在较高壁垒,目前行业中大多数公司只是数字人制作与运营全流程上的一环或其中几环。其次,服务场景与演艺场景没有有效打通,表现为演艺型数字人不具备客户所需的业务能力,而服务型数字人缺乏人设,难以与用户进行情感交流。第三是满足高机动性、高频需求的成本依旧很高,这一问题归根结底还是数字人的生产效率问题。

百度推出数字人平台“曦灵”

面对当前数字人制作的高门槛,在 2021 年 12 月底举办的百度 create 大会(百度 AI 开发者大会)上,百度 CTO 王海峰正式发布了“百度智能云曦灵数字人平台”, 搭建集数字人生产、内容创作、业务配置服务为一体的平台级产品。目前该产品已具备标准平台的快速交付能力,帮助不同领域客户快速实现敏捷型需求,降本增效。百度的数字人平台曦灵具有全场景、一站式、平台化的特点,能支持从最初数字人形象定制、人设管理再到业务编排、内容创作,最后到多种驱动模式下与用户互动的全部需求,这也意味着在一个平台上即可实现数字人的全链路调优,从而将效果做到最好。

image.png

李士岩以数字人生成环节为例,演示了百度智能云曦灵平台的功能。用户在百度智能云曦灵平台上传一张照片,就能快速生成一个可被AI驱动的 2D 数字人像,以前需要两三个月时间做出来的 3D 数字人,现在可以压缩到小时级,同时还可以通过一句话语音描述或简单捏脸等多种形式快速生产数字人。数字人个性化功能开发也较之前更加完善,以百度刚刚发布的 3D 超写实口语数字人为例,其口型合成准确率高达 98.5%。

image.png

在技术催生的数字人 3.0 阶段,虚拟人可与不同行业产生更紧密的融合。基于市场使用场景,数字人可以分为演艺型数字人、服务型数字人两类。

演艺术型数字人包括虚拟主播、虚拟偶像以及数字孪生的虚拟品牌代言人。目前百度已经打造了 AI 手语主播、央视网虚拟主持人小 C、航天局火星车数字人祝融号、百度虚拟代言人希加加、百度APP代言人龚俊数字人。

image.png

服务型数字人包括数字员工、虚拟员工、虚拟业务员等,可以帮助金融、运营商、政府、零售等行业提供基于数字人的新一代客户服务能力,解决排队长、回应慢、人力成本大等问题。目前,百度已经和浦发银行、光大银行、中国联通合作,推出了一对一服务型数字人。

image.png

百度在数字人技术上的突破,得益于其在行业内的持续布局。早在 2019 年,百度就开始了“虚拟数字人战略”。基于多年的 AI 技术沉淀, AI 能力已成为百度智能云曦灵平台的核心能力,现在百度也在把这种能力开放给外界。李士岩表示,“我们近两年的奋斗目标是通过百度智能云曦灵平台的开放,让每个人实现数字人自由。”

web元宇宙人工智能

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
进制的底层逻辑规则 左移<< 右移>> 取反加一 补位原则 正负数 相反数等 文章中含验证源码
进制的底层逻辑规则 左移<< 右移>> 取反加一 补位原则 正负数 相反数等 文章中含验证源码
17 0
DL之HNN:基于HNN(subplot)将凌乱数字矩阵图像(模拟手写数字图片)实现转为最相近的阿拉伯数字
DL之HNN:基于HNN(subplot)将凌乱数字矩阵图像(模拟手写数字图片)实现转为最相近的阿拉伯数字
60 0
CUMCM→MCM/ICM→NPMCM:关于国赛(全国大学生、研究生、博士研究生数学建模竞赛)和美赛中的数学的专业词汇详细攻略—美国数学建模竞赛(二)
CUMCM→MCM/ICM→NPMCM:关于国赛(全国大学生、研究生、博士研究生数学建模竞赛)和美赛中的数学的专业词汇详细攻略—美国数学建模竞赛
173 0
java 通过 URL 类和 URLConnection类 以及输入流实现文件下载功能
  package udp; import java.net.* ; import javax.swing.* ; import java.awt.event.*; import java.
763 0
文章
问答
文章排行榜
最热
最新
相关电子书
更多
如何用阿里云快速构建游戏发行技术体系
立即下载
案例:打造超越用户期待的服务体验
立即下载
案例:打造超越用户期待 的服务体验
立即下载