CVPR 2024:跳舞时飞扬的裙摆,AI也能高度还原了,南洋理工提出动态人体渲染新范式

简介: 【5月更文挑战第6天】南洋理工大学研究团队在CVPR 2024会议上提出SurMo,一种动态人体渲染新方法,能高度还原视频中的人物动作和细节,如飞扬的裙摆。SurMo通过4D运动建模,结合表面运动编码、物理运动解码和4D外观解码,实现动态图像的精确合成。尽管面临复杂动作捕捉和计算资源需求的挑战,SurMo在动态人体渲染任务上表现出色,展现了表面基运动三角平面的强大表达能力。[论文链接](https://arxiv.org/pdf/2404.01225.pdf)

在CVPR 2024会议上,南洋理工大学的研究团队提出了一种名为SurMo的新型动态人体渲染范式。该方法在动态人体渲染领域取得了显著的进展,能够高度还原出视频序列中人物的动作和外观,包括飞扬的裙摆等细节。

动态人体渲染是指根据人物的静态姿势生成对应的动态图像,这一技术在电影制作、游戏开发等领域有着广泛的应用。然而,现有的动态人体渲染方法往往只关注于单帧图像中人物外观的重建,而对人物动作的连续性和时间关系缺乏充分的探索。

为了解决这个问题,SurMo采用了一种全新的4D运动建模方法。它通过三个关键设计,实现了对人物动作和外观的联合建模:

首先,SurMo采用了基于表面的运动编码方式。它使用一种高效紧凑的表面基三角平面来描述4D人体运动。这种编码方式不仅能够在密集的表面流形上捕捉到空间和时间上的动作关系,还能够继承人体拓扑结构先验,从而在训练样本稀疏的情况下实现具有良好泛化能力的新颖视角合成。

其次,SurMo采用了物理运动解码方式。在训练阶段,它通过解码时间步t的运动三角平面特征来预测下一个时间步t+1的时空导数,从而鼓励模型学习到更符合物理规律的运动模式。

最后,SurMo采用了4D外观解码方式。它使用一种高效的体素表面条件渲染器,将运动三角平面渲染成图像。这种渲染器专注于身体表面的渲染,并利用运动学习进行条件化,从而能够生成高保真、视角一致的人体图像,甚至包括快速运动和运动依赖的阴影效果。

通过大量的实验验证,SurMo在动态人体渲染任务上取得了最先进的性能。它能够高度还原出人物的动作和外观,包括快速运动和复杂的身体姿势。此外,SurMo还展示了表面基运动三角平面在表达能力上的优越性,能够生成高质量的动态人体图像。

然而,SurMo也存在一些局限性。首先,由于它采用了基于表面的运动编码方式,对于一些复杂的人体动作,如手指的精细运动,可能无法完全捕捉到。其次,SurMo的训练和推理过程可能需要较大的计算资源,这对于一些实时应用场景可能存在挑战。

论文地址:https://arxiv.org/pdf/2404.01225.pdf

目录
相关文章
|
2月前
|
云安全 人工智能 安全
阿里云欧阳欣:AI时代下的安全新范式
2024 云栖大会技术主论坛重磅发布
743 4
阿里云欧阳欣:AI时代下的安全新范式
|
2月前
|
人工智能 自然语言处理 搜索推荐
AI战略丨SaaS 遇见 AI, 企业教培开启新范式
“我们会不断完善整体的工程能力,争取以最低的成本,帮助用户训练他们所需要的、好用的 AI 产品。”
|
14天前
|
人工智能 小程序
【一步步开发AI运动小程序】五、帧图像人体识别
随着AI技术的发展,阿里体育等公司推出的AI运动APP,如“乐动力”和“天天跳绳”,使云上运动会、线上健身等概念广受欢迎。本文将引导您从零开始开发一个AI运动小程序,使用“云智AI运动识别小程序插件”。文章分为四部分:初始化人体识别功能、调用人体识别功能、人体识别结果处理以及识别结果旋转矫正。下篇将继续介绍人体骨骼图绘制。
|
22天前
|
人工智能 自然语言处理 搜索推荐
通义灵码:AI辅助开发工具的新范式
在大模型时代,阿里云的通义灵码作为AI辅助开发工具,通过提高开发效率、简化协作和降低成本,重塑了软件开发的核心要素。通义灵码基于大模型和自然语言处理技术,实时辅助代码编写、调试和优化,提供个性化支持,显著提升了开发体验。未来,AI将在软件开发中发挥更大作用,通义灵码将继续引领这一变革。
58 0
通义灵码:AI辅助开发工具的新范式
|
1月前
|
人工智能 算法 决策智能
面向软件工程的AI智能体最新进展,复旦、南洋理工、UIUC联合发布全面综述
【10月更文挑战第9天】近年来,基于大型语言模型(LLM)的智能体在软件工程领域展现出显著成效。复旦大学、南洋理工大学和伊利诺伊大学厄巴纳-香槟分校的研究人员联合发布综述,分析了106篇论文,探讨了这些智能体在需求工程、代码生成、静态代码检查、测试、调试及端到端软件开发中的应用。尽管表现出色,但这些智能体仍面临复杂性、性能瓶颈和人机协作等挑战。
75 1
|
2月前
|
云安全 人工智能 安全
AI时代云安全新范式,阿里云安全能力全线升级!
AI时代,云安全面临着新的挑战,不仅要持续面对以往的传统问题,更需要全新理念落地于产品设计、技术演进、架构设计,才能实现效果、性能、和成本的最优解。
97 6
|
29天前
|
机器学习/深度学习 人工智能 算法框架/工具
基于人体姿势估计的舞蹈检测(AI Dance based on Human Pose Estimation)
基于人体姿势估计的舞蹈检测(AI Dance based on Human Pose Estimation)
51 0
|
5月前
|
人工智能 算法 计算机视觉
无论真实还是AI视频,摩斯卡都能重建恢复4D动态可渲染场景
【6月更文挑战第30天】摩斯卡系统革命性地从单视角视频重建4D动态场景,融合2D视觉模型与物理优化,实现渲染。利用“Motion Scaffold”表示几何、外观和运动,即使在多视角输入困难时也能保证高质量重建与渲染。虽有输入质量和计算资源限制,但其创新性提升了动态场景处理的实用性和可控性。[arXiv:2405.17421](https://arxiv.org/pdf/2405.17421)
58 2
|
5月前
|
SQL 人工智能 Devops
《AIGC+软件开发新范式》--01.当「软件研发」遇上 AI 大模型(1)
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
184 0
|
5月前
|
人工智能 自然语言处理 IDE
《AIGC+软件开发新范式》--01.当「软件研发」遇上 AI 大模型(2)
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
150 1

热门文章

最新文章