带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(3)

简介: 带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究

带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(2)

https://developer.aliyun.com/article/1262086?groupCode=taobaotech



美颜

妆容的细节要求非常多,所以最便捷的方式就是使用贴图。基础形体的脸部已经有一张基础贴图了,可以简单理解 成“素颜”;要在素颜上画不同的妆容,我们做法是“动态合成纹理”。整个过程分为两步。


渲染到纹理(Render To Texture):第一步创建一个可渲染对象(Render Target),把基础纹理贴图渲染到这 个可渲染对象上,再把妆容纹理贴图渲染到同一个可渲染对象上。这一步需要注意艺术家在绘制妆容纹理时,需要 和基础纹理的UV是一一对应的。


使用可渲染纹理:第二步就是把合成好的纹理渲染到模型上。


二次元还是三次元 - 渲染风格

最后到了给它设定风格的时候。有人会喜欢真实系,有人也会喜欢卡通系,也会有人喜欢朋克风,也会有人喜欢纯 欲风,这些不同的风格需要依靠渲染功能来完成。当我们说到渲染时,都会提到图形渲染管线,它可以根据不同的 需求做很多组合和调整,比如最简单的渲染管线是:加载模型 ---> 顶点着色 ---> 片元着色 ---> 光栅化。其中 片元着色的步骤,就是用来完成材质纹理的绘制使之达到想要的角色风格。对材质纹理的绘制通常分为两大类:


PBR

全称Physically Based Rendering,顾名思义是基于物理的渲染,既然是基于物理的,那么它渲染的最终结果会非 常接近我们的真实世界。所以也就很好理解,这类材质可以决定人物是写实或超写实风格的。此技术由8大核心理论 和几个重要的光照模型组成,在此不一一列举,有兴趣的同学可以去阅读《Real-Time Rendering》中的PBR相 关章节,或是SIGGRAPH的《Physically Based Shading in Theory and Practice》系列文章。例如在淘宝人生 中,根据不同部位选取渐变贴图上采样色的方式模拟了次表面散射的技术,实现了人脸皮肤的红润通透感。


NPR

全称Non-photorealistic Rendering,即非真实感绘制。其最主要的应用之一,就是非常盛行的二次元风格,特别 是日式卡通风格。和PBR不一样,NPR不会去追求各种物理学模拟,而是从油画、素描、卡通动画中得到启发和灵 感。比如,经常被使用的人物描边、卡通着色、边缘光、头发高光等。这些特殊的材质渲染也都能在找到专业的论 文和例子,大家可以自行搜索。


这个章节我们来完成虚拟数字人的动 - “拥有和人相似的行为,具有用语言、表情和肢体等表达的能力”。


image.png


表情和动作

成功塑造虚拟数字人的关键之一是真实且细腻的表情和动作。真人的表情和动作是依靠骨骼和肌肉相互作用而呈现 的,在虚拟世界中,我们同样用数字技术来模拟这些骨骼和肌肉的作用,呈现表情和动作。在上面“形”的章节 里,已经提到了脸部使用了骨骼蒙皮和混合变形的方式来改变顶点,在“动”的章节里,仍然会使用这两项技术, 并且通过动画的方式让顶点“动”起来,从而完成相应的表情和动作。  


手K动画

在脸部表情的刻画中,顶点动画(也就是Morph Target Animation)是主要实现技术之一。在淘宝人生的“捏 脸”功能中骨骼蒙皮是用来确定脸的大小和五官的位置的。混合变形则是用来完成五官包括脸颊、额头部位的变 形,其中用于表情动画的BlendShape多达50个,它和苹果的Animoji使用的BlendShape非常接近,这也是业界 公认的可以做到绝大多数表情(当然很多微表情非常难达到)的设定。


image.png


在肢体动作的制作中,骨骼动画(也就是SkeletalAnimation)是主要实现技术之一。骨骼动画包含了骨骼(Skeleton)和蒙皮(Skin)两种数据。首先把Mesh的顶点绑定在骨骼上生成蒙皮,这些顶点会受到多个不同权重骨骼的 影响,然后通过改变骨骼的朝向和位置来生成动画,这时蒙皮就会跟着骨骼一起动起来。


image.png


带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(4)

https://developer.aliyun.com/article/1262082?groupCode=taobaotech

相关文章
|
7月前
|
传感器 人工智能 搜索推荐
|
19天前
|
API 语音技术 开发者
基于开源技术的数字人实时对话:形象可自定义,支持语音输入,对话首包延迟可低至3s
魔搭社区最近上线了基于开源技术的数字人实时对话demo,无需预训练即可使用自定义的数字人形象进行实时对话,支持语音输入和实时对话。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】python之人工智能应用篇--数字人生成技术
数字人生成技术是基于人工智能技术和计算机图形学技术创建的虚拟人物形象的技术。该技术能够模拟人类的外貌、声音、动作和交流能力,为多个领域带来创新的应用可能性。数字人的本质是将所有信息(数字和文字)通过数字处理(如计算机视觉、语音识别等)再进行表达的过程,形成具有人类形态和行为的数字产物。 数字人的生成涉及到多种技术,如3D重建技术,使用三维扫描仪扫描人的外观、五官等,并通过3D模型重建三维人;虚拟直播技术,使用计算机技术生成人物或实体,并且可以实时直播、录制;数字人体数据集技术,利用数据构建数字人模型以及训练虚拟现实引擎等
127 4
|
5月前
|
新零售 人工智能 vr&ar
国家发展改革委等部门:鼓励利用数字人等技术拓展电商直播场景!
国家发改委推出措施鼓励创新消费场景,特别提到利用AI、VR等技术增强购物体验,支持数字人电商。青否数字人直播系统提供独立部署方案,适应抖音直播并解决封号问题,具备实时话术改写和AI智能回复功能,确保互动合规。此系统适用于24小时直播,降低商家成本,提升效率。欲了解更多信息,可访问:zhibo175。
国家发展改革委等部门:鼓励利用数字人等技术拓展电商直播场景!
|
6月前
|
算法
VASA-1:实时音频驱动的数字人说话面部视频生成技术
【6月更文挑战第8天】VASA-1是实时音频驱动的数字人面部视频生成技术,能根据输入音频精准生成匹配的面部表情。具备实时性、高准确性和适应性,适用于虚拟主播、在线教育和影视娱乐等领域。简单示例代码展示了其工作原理。尽管面临情感理解和硬件优化等挑战,但随着技术发展,VASA-1有望在更多领域广泛应用,开启生动数字世界的新篇章。
291 5
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
647 0
|
传感器 人工智能 达摩院
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(1)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
188 0
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(1)
|
对象存储 流计算 CDN
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(2)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
187 0
|
机器学习/深度学习 达摩院 前端开发
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(4)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
165 0
|
数据采集 前端开发 大数据
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究(5)
带你读《2022技术人的百宝黑皮书》——虚拟数字人行业现状和技术研究
237 0

热门文章

最新文章