CVPR 2024：跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式-阿里云开发者社区

CVPR 2024：跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

2024-05-07 167

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【5月更文挑战第6天】南洋理工大学研究团队在CVPR 2024会议上提出SurMo，一种动态人体渲染新方法，能高度还原视频中的人物动作和细节，如飞扬的裙摆。SurMo通过4D运动建模，结合表面运动编码、物理运动解码和4D外观解码，实现动态图像的精确合成。尽管面临复杂动作捕捉和计算资源需求的挑战，SurMo在动态人体渲染任务上表现出色，展现了表面基运动三角平面的强大表达能力。[论文链接](https://arxiv.org/pdf/2404.01225.pdf)

在CVPR 2024会议上，南洋理工大学的研究团队提出了一种名为SurMo的新型动态人体渲染范式。该方法在动态人体渲染领域取得了显著的进展，能够高度还原出视频序列中人物的动作和外观，包括飞扬的裙摆等细节。

动态人体渲染是指根据人物的静态姿势生成对应的动态图像，这一技术在电影制作、游戏开发等领域有着广泛的应用。然而，现有的动态人体渲染方法往往只关注于单帧图像中人物外观的重建，而对人物动作的连续性和时间关系缺乏充分的探索。

为了解决这个问题，SurMo采用了一种全新的4D运动建模方法。它通过三个关键设计，实现了对人物动作和外观的联合建模：

首先，SurMo采用了基于表面的运动编码方式。它使用一种高效紧凑的表面基三角平面来描述4D人体运动。这种编码方式不仅能够在密集的表面流形上捕捉到空间和时间上的动作关系，还能够继承人体拓扑结构先验，从而在训练样本稀疏的情况下实现具有良好泛化能力的新颖视角合成。

其次，SurMo采用了物理运动解码方式。在训练阶段，它通过解码时间步t的运动三角平面特征来预测下一个时间步t+1的时空导数，从而鼓励模型学习到更符合物理规律的运动模式。

最后，SurMo采用了4D外观解码方式。它使用一种高效的体素表面条件渲染器，将运动三角平面渲染成图像。这种渲染器专注于身体表面的渲染，并利用运动学习进行条件化，从而能够生成高保真、视角一致的人体图像，甚至包括快速运动和运动依赖的阴影效果。

通过大量的实验验证，SurMo在动态人体渲染任务上取得了最先进的性能。它能够高度还原出人物的动作和外观，包括快速运动和复杂的身体姿势。此外，SurMo还展示了表面基运动三角平面在表达能力上的优越性，能够生成高质量的动态人体图像。

然而，SurMo也存在一些局限性。首先，由于它采用了基于表面的运动编码方式，对于一些复杂的人体动作，如手指的精细运动，可能无法完全捕捉到。其次，SurMo的训练和推理过程可能需要较大的计算资源，这对于一些实时应用场景可能存在挑战。

论文地址：https://arxiv.org/pdf/2404.01225.pdf

CVPR 2024：跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

CVPR 2024：跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

热门文章

最新文章

相关课程

相关电子书

相关实验场景