带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(4)
https://developer.aliyun.com/article/1262082?groupCode=taobaotech
我们向往的数字人
淘宝人生是基于Web技术打造的数字人,在经历了2年的技术打磨和升级改造,我们也遇到了Web数字人技术的困 境。在性能方面,Web应用和原生应用存在无可忽视的差距。WebGL(基于OpenGL ES 2.0)作为Web主要的 图形接口在Vulkan、DirectX、Metal面前无论是能力还是性能上都无法追赶。再加上不同的移动设备在软硬件上 仍会出现奇奇怪怪的兼容性问题。这一系列困境已经成为了Web中的数字人一个很难跨越的天花板。
反观行业中的数字人技术,超写实渲染、微表情、肌肉模拟、物理材质、光线追踪等等,让身处Web技术中的我们 望尘莫及。同时,阿里的虚拟数字人技术也才刚刚起步,其中基础软硬件、中台技术、大数据支撑等也都起步较 晚,这些都给我们带来了不小的困难和阻力。
面对这些困境和差距,我们针对淘宝人生中虚拟数字人技术的发展也会从各个方向上去做努力和尝试。
首先是基于Web技术的优化:在Serverless渲染云服务基础上,在EVA Figure(虚拟人像渲染引擎)和Puppeteer技术的结合下,借助最新的WebGPU/WASM等,让虚拟数字人的渲染效果和质量得到提升。我们也在积极同 阿里云云服务团队、大淘宝Node架构团队一起合作建设Web技术下的云渲染流程。计划把它应用在一些非实时的 渲染任务上,例如生产淘宝人生用户形象的全身照片、短视频、动作帧图等等。这些产物也能被淘宝人生业务或其 他业务所使用。
其次是对业务能力的升级,在业务和技术相互滋养的土壤中,不断将业务能力积累成平台服务,为阿里的虚拟数字 人技术贡献点点滴滴的经验,并将部分解决方案通过商业化上云的方式服务大众。
然后在元宇宙、超写实、XR/6G、脑机接口等等行业风向标的辐射下,畅想未来Web数字人技术可能性。
文末特别感谢下阿里前端委员会图形互动虚拟角色小组成员的出色工作,让我能完成此文章内容。也欢迎大家持续 关注虚拟角色小组和各个团队的成果。
团队介绍
大淘宝技术互动团队目前负责“天猫农场”、“金币庄园”、“淘宝人生”这3个手淘内千万级的互动产品,重点打 造双促、春节、市场PR等S/A级营销互动,同时为商家、达人、主播等沉淀和提供私域内的互动玩法。
面向业务,我们基于阿里模块标准,在成熟的搭建平台上完成页面的模块级搭建;面向研发,我们依靠整个阿里经 济体强大的基础生态来保障互动领域研发能力高效且合理的触达用户;我们拥有完全自研的互动研发体系EVA,同 时EVA体系的建设也和阿里经济体互动方向紧密结合在一起,打造整个经济体最优秀的互动解决方案,并最终实现 我们的愿景:人人可开发、处处有互动。
同时,我们是一支拥有战友情、兄弟义,能自嘲、能自嗨,不敷衍工作、不耽误生活的充满活力和想象力的团队, 我们有本来可以靠颜值却偏偏要靠实力的小姐姐们、也有一群群推着前浪大踏步向前的后浪,还有许许多多可靠、 个性、自信的小伙伴。我相信这样一只具有鲜明技术特色、又屹立于手淘业务一线的团队,一定会是屏幕前的你希 望且愿意加入的团队。欢迎投递简历至:zhuxun.jb@alibaba-inc.com
参考文献
《艾媒咨询|2021中国虚拟偶像行业发展及网民调查研究报告》https://www.iimedia.cn/c400/79469.html
《三维软件知多少》http://www.bgteach.com/article/40
《三维文件格式知多少》https://www.bgteach.com/article/132
《glTFTutorial》https://github.com/KhronosGroup/glTF-Tutorials/tree/master/gltfTutorial
《Vertex Transformation》https://www.khronos.org/opengl/wiki/Vertex_Transformation
《WebGL Skinning》https://webglfundamentals.org/webgl/lessons/webgl-skinning.html
《MorphTarget》https://en.wikipedia.org/wiki/Morph_target_animation
《Real-time Rendering》https://www.realtimerendering.com/
《MovingFrostbite toPBR3.0》https://seblagarde.files.wordpress.com/2015/07/course_notes_moving_frostbite_to_pbr_v32.pdf
《StylizedRenderinginGame》http://stylized.realtimerendering.com/
《基于物理的渲染(PBR)白皮书》https://zhuanlan.zhihu.com/p/53086060 《ARkitFaceBlendshapes》https://arkit-face-blendshapes.com/ 《OpenGLSkeletalAnimation》https://www.khronos.org/opengl/wiki/Skeletal_Animation
《类卡通效果与写实人脸的52个blendshape效果对比及变化说明》https://www.bilibi - li.com/read/cv11763241
《MotionCapture》https://en.wikipedia.org/wiki/Motion_capture 《MotionCaptureSystem》https://scholar.google.com/scholar?q=Motion+capture+system&hl=zh-CN&as_sdt=0&as_vis=1&oi=scholart 《GameEngineArchitecture3rd-AnimationBlending》https://www.gameenginebook.com/toc.html
《游戏引擎动画系统阅读笔记》https://zhuanlan.zhihu.com/p/374343190
《语音识别技术》https://scholar.google.com/scholar?hl=zh-CN&as_s - dt=0%2C5&as_vis=1&q=%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%AB%E6%8A%80%E 6%9C%AF&btnG=
《语音合成技术》https://scholar.google.com/schol - ar?q=%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%E6%8A%80%E6%9C%AF&hl=zhCN&as_sdt=0&as_vis=1&oi=scholart
《MetaHuman》https://www.unrealengine.com/en-US/digital-humans