Sitcom-Crafter:动画师失业警告!AI黑科技自动生成3D角色动作,剧情脚本秒变动画

本文涉及的产品
视觉智能开放平台,视频通用资源包5000点
视觉智能开放平台,图像通用资源包5000点
视觉智能开放平台,分割抠图1万点
简介: Sitcom-Crafter 是一款基于剧情驱动的 3D 动作生成系统,通过多模块协同工作,支持人类行走、场景交互和多人交互,适用于动画、游戏及虚拟现实等领域。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🚀 「当LLM遇见3D物理引擎:开源框架实现剧本→动画全自动生成」
大家好,我是蚝油菜花。在SIGGRAPH 2024引爆讨论的Sitcom-Crafter,正在重新定义3D内容创作:

三大技术革命:

  • 1️⃣ 场景感知SDF:无需数据采集即可模拟真实物理交互
  • 2️⃣ 多智能体协同:20+角色同步生成无碰撞动作
  • 3️⃣ 跨平台重定向:5分钟适配Maya/Blender/Unity工作流

从独立游戏到影视级动画,这套系统已帮助团队将动作制作效率提升300%。接下来我们将深度解析其八大模块如何协作——你的动画师可能要转型AI教练了!

🚀 快速阅读

Sitcom-Crafter 是一个基于剧情驱动的 3D 动作生成系统,能够高效生成符合物理逻辑的动作。

  1. 核心功能:支持人类行走、场景交互和多人交互,并通过增强模块优化动作流畅性和自然性。
  2. 技术原理:结合自监督 SDF 策略和扩散模型,解决碰撞问题并生成多样化的动作。

Sitcom-Crafter 是什么

Sitcom-Crafter-Teaser-detail

Sitcom-Crafter 是一套综合性的 3D 场景中人类动作生成系统,旨在通过剧情指导生成多样化且物理真实的动作。它由八大部分组成,其中三大模块专注于运动生成,其余五个模块则用于动作优化和增强。

该系统的核心创新点在于其 3D 场景感知技术和自监督 SDF 策略,无需额外数据采集即可生成符合物理逻辑的动作。这种设计显著提升了创作效率,为动画制作、游戏开发以及虚拟现实等领域的设计师提供了高效的智能化解决方案。

此外,Sitcom-Crafter 支持多种动作类型,包括人类行走、人与场景交互以及人与人之间的交互。这使得它在复杂剧情驱动的任务中表现尤为突出。

Sitcom-Crafter 的主要功能

  • 人类行走:角色在 3D 场景中自然行走,支持动态路径规划。
  • 人类与场景交互:角色与环境物体进行符合物理逻辑的交互,例如开门或拾取物品。
  • 人类之间交互:角色之间协调动作,减少碰撞并优化同步性。
  • 剧情解析:通过大型语言模型解析剧本,转化为具体的角色动作指令。
  • 运动同步:确保不同模块生成的运动在时间上保持一致。
  • 手部姿态增强:检索数据库中的手部姿态以增强运动的自然性。
  • 碰撞修正:自动检测并修正人物之间的碰撞。
  • 3D 重定向:将生成的运动映射到现有的 3D 数字人物模型,提升视觉效果。

Sitcom-Crafter 的技术原理

Sitcom-Crafter-framework

  • 运动生成模块
    • 人类行走生成:基于 GAMMA 等方法,通过深度学习模型生成行走运动。
    • 人与场景交互生成:结合 DIMOS 方法,利用场景信息生成交互动作。
    • 人与人交互生成:使用自监督场景感知方法,通过 SDF 点模拟周围环境,避免碰撞并生成多人交互动作。
  • 场景感知技术
    • SDF 点合成:随机生成周围物体的 SDF 点,模拟障碍物。
    • 碰撞检测与修正:通过 SDF 点调整运动轨迹或速度,避免碰撞。
  • 剧情理解与命令生成:使用大型语言模型(如 Gemini 1.5)解析剧情文本,转化为具体运动指令。
  • 增强模块
    • 运动同步:通过插值技术确保不同模块生成的运动平滑过渡。
    • 手部姿态检索:利用 CLIP 模型检索最相似的手部姿态。
    • 碰撞修正:调整运动速度或路径,避免人物之间的碰撞。
    • 3D 重定向:将生成的运动映射到高质量的 3D 数字人物模型。

如何运行 Sitcom-Crafter

1. 环境配置

Sitcom-Crafter 需要以下硬件和软件环境:

  • 硬件要求
    • GPU:建议使用多块 GPU 进行训练;单块 GPU 至少需要 12GB 显存。
  • 软件要求
    • Python:3.10 或更高版本。
    • CUDA:11.8 或更高版本。
    • cuDNN:8.4.1 或更高版本。

安装依赖项:

pip install -r requirements.txt
AI 代码解读

注意:部分依赖包(如 pointnet2_opspytorch3d)可能需要手动编译,请参考官方文档完成安装。

2. 数据准备

InterHuman 数据集

下载 InterHuman 数据集并将其转换为标记点格式:

cd HHInter
python rearrange_dataset.py
AI 代码解读

Inter-X 数据集

下载 Inter-X 数据集并进行类似处理:

cd HHInter
python rearrange_dataset_interX.py
AI 代码解读

3. 运行示例

执行以下命令以生成基于剧情驱动的动作序列:

cd HSInter
python synthesize/demo_hsi_auto.py
AI 代码解读

需确保已正确配置预训练模型路径,并根据需求修改 save_path_name 参数。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

目录
打赏
0
2
4
0
401
分享
相关文章
斯坦福黑科技让笔记本GPU也能玩转AI视频生成!FramePack:压缩输入帧上下文长度!仅需6GB显存即可生成高清动画
斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度,解决视频生成中的"遗忘"和"漂移"问题,仅需6GB显存即可在普通笔记本上实时生成高清视频。
738 19
斯坦福黑科技让笔记本GPU也能玩转AI视频生成!FramePack:压缩输入帧上下文长度!仅需6GB显存即可生成高清动画
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。
840 9
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
模型手动绑骨3天,AI花3分钟搞定!UniRig:清华开源通用骨骼自动绑定框架,助力3D动画制作
UniRig是清华大学与VAST联合研发的自动骨骼绑定框架,基于自回归模型与交叉注意力机制,支持多样化3D模型的骨骼生成与蒙皮权重预测,其创新的骨骼树标记化技术显著提升动画制作效率。
509 27
模型手动绑骨3天,AI花3分钟搞定!UniRig:清华开源通用骨骼自动绑定框架,助力3D动画制作
AI浪潮下,医生、老师、律师何以不失业?
本文探讨了人工智能(AI)在医生、老师和律师等传统职业中的应用,强调AI与其说是替代,不如说是辅助与协作的关系。在医疗领域,AI助力医生提高诊断效率;在教育行业,AI为老师提供个性化教学支持;在法律界,AI帮助律师优化案件分析。同时,生成式人工智能认证(GAI认证)可提升从业者竞争力,推动跨领域合作。总之,AI不仅不会导致失业,反而将促进这些职业的转型升级,创造更多价值与发展机会。
Stable Virtual Camera:2D秒变3D电影!Stability AI黑科技解锁无限运镜,自定义轨迹一键生成
Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频,支持自定义相机轨迹和多种动态路径,生成高质量且时间平滑的视频。
216 0
Stable Virtual Camera:2D秒变3D电影!Stability AI黑科技解锁无限运镜,自定义轨迹一键生成
测试工程师要失业?Magnitude:开源AI Agent驱动的端到端测试框架,让Web测试更智能,自动完善测试用例!
Magnitude是一个基于视觉AI代理的开源端到端测试框架,通过自然语言构建测试用例,结合推理代理和视觉代理实现智能化的Web应用测试,支持本地运行和CI/CD集成。
479 15
测试工程师要失业?Magnitude:开源AI Agent驱动的端到端测试框架,让Web测试更智能,自动完善测试用例!
这个模型让AI角色会说话还会演!MoCha:Meta联手滑铁卢大学打造对话角色视频生成黑科技
MoCha是由Meta与滑铁卢大学联合开发的端到端对话角色视频生成模型,通过创新的语音-视频窗口注意力机制实现精准的唇语同步和全身动作生成。
234 12
这个模型让AI角色会说话还会演!MoCha:Meta联手滑铁卢大学打造对话角色视频生成黑科技
DreamActor-M1:字节跳动推出AI动画黑科技,静态照片秒变生动视频
DreamActor-M1是字节跳动研发的AI图像动画框架,通过混合引导机制实现高保真人物动画生成,支持多语言语音驱动和形状自适应功能。
523 40
DreamActor-M1:字节跳动推出AI动画黑科技,静态照片秒变生动视频
TripoSR:开源3D生成闪电战!单图0.5秒建模,Stability AI颠覆设计流程
TripoSR是由Stability AI和VAST联合推出的开源3D生成模型,能在0.5秒内从单张2D图像快速生成高质量3D模型,支持游戏开发、影视制作等多领域应用。
186 13
TripoSR:开源3D生成闪电战!单图0.5秒建模,Stability AI颠覆设计流程
AI赋能教育评价改革:生成式人工智能(GAI)认证的角色与影响
本文探讨了人工智能(AI)技术在教育评价改革中的作用及生成式人工智能(GAI)认证的影响。随着数字化时代的到来,AI为教育评价提供了新工具与手段,能够优化评价过程、提升质量并促进个性化发展。GAI认证不仅提升了教育工作者的技能与竞争力,还推动了教育评价的标准化与规范化。文章强调需加强AI技术应用研究、推广GAI认证,并注重评价的个性化与差异化,以助力学生全面发展。AI赋能教育评价改革是未来趋势,将为教育事业注入更多智慧与力量。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问