带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(5)

简介: 带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究

带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(4)

https://developer.aliyun.com/article/1262082?groupCode=taobaotech



我们向往的数字人


淘宝人生是基于Web技术打造的数字人,在经历了2年的技术打磨和升级改造,我们也遇到了Web数字人技术的困 境。在性能方面,Web应用和原生应用存在无可忽视的差距。WebGL(基于OpenGL ES 2.0)作为Web主要的 图形接口在Vulkan、DirectX、Metal面前无论是能力还是性能上都无法追赶。再加上不同的移动设备在软硬件上 仍会出现奇奇怪怪的兼容性问题。这一系列困境已经成为了Web中的数字人一个很难跨越的天花板。


反观行业中的数字人技术,超写实渲染、微表情、肌肉模拟、物理材质、光线追踪等等,让身处Web技术中的我们 望尘莫及。同时,阿里的虚拟数字人技术也才刚刚起步,其中基础软硬件、中台技术、大数据支撑等也都起步较 晚,这些都给我们带来了不小的困难和阻力。


image.png


面对这些困境和差距,我们针对淘宝人生中虚拟数字人技术的发展也会从各个方向上去做努力和尝试。


首先是基于Web技术的优化:在Serverless渲染云服务基础上,在EVA Figure(虚拟人像渲染引擎)和Puppeteer技术的结合下,借助最新的WebGPU/WASM等,让虚拟数字人的渲染效果和质量得到提升。我们也在积极同 阿里云云服务团队、大淘宝Node架构团队一起合作建设Web技术下的云渲染流程。计划把它应用在一些非实时的 渲染任务上,例如生产淘宝人生用户形象的全身照片、短视频、动作帧图等等。这些产物也能被淘宝人生业务或其 他业务所使用。


其次是对业务能力的升级,在业务和技术相互滋养的土壤中,不断将业务能力积累成平台服务,为阿里的虚拟数字 人技术贡献点点滴滴的经验,并将部分解决方案通过商业化上云的方式服务大众。


然后在元宇宙、超写实、XR/6G、脑机接口等等行业风向标的辐射下,畅想未来Web数字人技术可能性。


文末特别感谢下阿里前端委员会图形互动虚拟角色小组成员的出色工作,让我能完成此文章内容。也欢迎大家持续 关注虚拟角色小组和各个团队的成果。


团队介绍


大淘宝技术互动团队目前负责“天猫农场”、“金币庄园”、“淘宝人生”这3个手淘内千万级的互动产品,重点打 造双促、春节、市场PR等S/A级营销互动,同时为商家、达人、主播等沉淀和提供私域内的互动玩法。


面向业务,我们基于阿里模块标准,在成熟的搭建平台上完成页面的模块级搭建;面向研发,我们依靠整个阿里经 济体强大的基础生态来保障互动领域研发能力高效且合理的触达用户;我们拥有完全自研的互动研发体系EVA,同 时EVA体系的建设也和阿里经济体互动方向紧密结合在一起,打造整个经济体最优秀的互动解决方案,并最终实现 我们的愿景:人人可开发、处处有互动。


同时,我们是一支拥有战友情、兄弟义,能自嘲、能自嗨,不敷衍工作、不耽误生活的充满活力和想象力的团队, 我们有本来可以靠颜值却偏偏要靠实力的小姐姐们、也有一群群推着前浪大踏步向前的后浪,还有许许多多可靠、 个性、自信的小伙伴。我相信这样一只具有鲜明技术特色、又屹立于手淘业务一线的团队,一定会是屏幕前的你希 望且愿意加入的团队。欢迎投递简历至:zhuxun.jb@alibaba-inc.com


参考文献


《艾媒咨询|2021中国虚拟偶像行业发展及网民调查研究报告》https://www.iimedia.cn/c400/79469.html

《三维软件知多少》http://www.bgteach.com/article/40

《三维文件格式知多少》https://www.bgteach.com/article/132

《glTFTutorial》https://github.com/KhronosGroup/glTF-Tutorials/tree/master/gltfTutorial

《Vertex Transformation》https://www.khronos.org/opengl/wiki/Vertex_Transformation

《WebGL Skinning》https://webglfundamentals.org/webgl/lessons/webgl-skinning.html

《MorphTarget》https://en.wikipedia.org/wiki/Morph_target_animation

《Real-time Rendering》https://www.realtimerendering.com/

《MovingFrostbite toPBR3.0》https://seblagarde.files.wordpress.com/2015/07/course_notes_moving_frostbite_to_pbr_v32.pdf

《StylizedRenderinginGame》http://stylized.realtimerendering.com/

《基于物理的渲染(PBR)白皮书》https://zhuanlan.zhihu.com/p/53086060 《ARkitFaceBlendshapes》https://arkit-face-blendshapes.com/ 《OpenGLSkeletalAnimation》https://www.khronos.org/opengl/wiki/Skeletal_Animation

《类卡通效果与写实人脸的52个blendshape效果对比及变化说明》https://www.bilibi - li.com/read/cv11763241

《MotionCapture》https://en.wikipedia.org/wiki/Motion_capture 《MotionCaptureSystem》https://scholar.google.com/scholar?q=Motion+capture+system&hl=zh-CN&as_sdt=0&as_vis=1&oi=scholart 《GameEngineArchitecture3rd-AnimationBlending》https://www.gameenginebook.com/toc.html

《游戏引擎动画系统阅读笔记》https://zhuanlan.zhihu.com/p/374343190

《语音识别技术》https://scholar.google.com/scholar?hl=zh-CN&as_s - dt=0%2C5&as_vis=1&q=%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%AB%E6%8A%80%E 6%9C%AF&btnG=

《语音合成技术》https://scholar.google.com/schol - ar?q=%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%E6%8A%80%E6%9C%AF&hl=zhCN&as_sdt=0&as_vis=1&oi=scholart

《MetaHuman》https://www.unrealengine.com/en-US/digital-humans

相关文章
|
6月前
|
传感器 人工智能 搜索推荐
|
8天前
|
API 语音技术 开发者
基于开源技术的数字人实时对话:形象可自定义,支持语音输入,对话首包延迟可低至3s
魔搭社区最近上线了基于开源技术的数字人实时对话demo,无需预训练即可使用自定义的数字人形象进行实时对话,支持语音输入和实时对话。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】python之人工智能应用篇--数字人生成技术
数字人生成技术是基于人工智能技术和计算机图形学技术创建的虚拟人物形象的技术。该技术能够模拟人类的外貌、声音、动作和交流能力,为多个领域带来创新的应用可能性。数字人的本质是将所有信息(数字和文字)通过数字处理(如计算机视觉、语音识别等)再进行表达的过程,形成具有人类形态和行为的数字产物。 数字人的生成涉及到多种技术,如3D重建技术,使用三维扫描仪扫描人的外观、五官等,并通过3D模型重建三维人;虚拟直播技术,使用计算机技术生成人物或实体,并且可以实时直播、录制;数字人体数据集技术,利用数据构建数字人模型以及训练虚拟现实引擎等
109 4
|
4月前
|
新零售 人工智能 vr&ar
国家发展改革委等部门:鼓励利用数字人等技术拓展电商直播场景!
国家发改委推出措施鼓励创新消费场景,特别提到利用AI、VR等技术增强购物体验,支持数字人电商。青否数字人直播系统提供独立部署方案,适应抖音直播并解决封号问题,具备实时话术改写和AI智能回复功能,确保互动合规。此系统适用于24小时直播,降低商家成本,提升效率。欲了解更多信息,可访问:zhibo175。
国家发展改革委等部门:鼓励利用数字人等技术拓展电商直播场景!
|
5月前
|
算法
VASA-1:实时音频驱动的数字人说话面部视频生成技术
【6月更文挑战第8天】VASA-1是实时音频驱动的数字人面部视频生成技术,能根据输入音频精准生成匹配的面部表情。具备实时性、高准确性和适应性,适用于虚拟主播、在线教育和影视娱乐等领域。简单示例代码展示了其工作原理。尽管面临情感理解和硬件优化等挑战,但随着技术发展,VASA-1有望在更多领域广泛应用,开启生动数字世界的新篇章。
274 5
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
629 0
|
传感器 人工智能 达摩院
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(1)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
188 0
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(1)
|
对象存储 流计算 CDN
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(2)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
185 0
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(3)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
169 0
|
机器学习/深度学习 达摩院 前端开发
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(4)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
164 0

热门文章

最新文章