DynamicCity:上海AI Lab开源4D场景神器助力自动驾驶场景!128帧动态LiDAR生成,1:1还原城市早晚高峰

本文涉及的产品
视觉智能开放平台,图像通用资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频通用资源包5000点
简介: DynamicCity 是上海 AI Lab 推出的 4D 动态场景生成框架,专注于生成具有语义信息的大规模动态 LiDAR 场景,适用于自动驾驶、机器人导航和交通流量分析等多种应用场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🛣️ “还在为自动驾驶测试犯愁?上海AI Lab放出4D场景核弹:128帧动态LiDAR生成,1:1还原城市早晚高峰!”
大家好,我是蚝油菜花。如果你正在经历——

  • 👉 斥资百万采集真实路测数据,雨天/夜间的极端场景仍难覆盖
  • 👉 模拟器的动态物体像‘纸片人’,导致感知模型泛化性差
  • 👉 场景重建工具只能处理静态环境,车辆轨迹全靠人工设计...

那么 DynamicCity 将是你的救星!这个由上海AI Lab研发的4D动态场景框架,基于 DiT+VAE融合架构,能生成80×80米大范围、128帧连续动态的LiDAR点云。更震撼的是,它支持 轨迹引导生成指令驱动控制 ——想象一下,用自然语言描述“早高峰十字路口突发急刹”,立刻获得带物理规律的4D场景数据!接下来我们将拆解其HexPlane黑科技,手把手教你在自动驾驶训练中落地应用。

🚀 快速阅读

DynamicCity 是一个强大的 4D 动态场景生成框架。

  1. 核心功能:生成大规模、高质量的动态 LiDAR 场景,支持轨迹引导、指令驱动等多样化应用。
  2. 技术原理:基于 VAE 和扩散模型(DiT),通过 HexPlane 表示和条件注入实现高效生成。

DynamicCity 是什么

DynamicCity

DynamicCity 是上海 AI Lab 推出的一个大规模动态场景生成框架,专注于生成具有语义信息的动态 LiDAR 场景。它能够处理大规模空间(80×80×6.4 m³)和长序列(最多 128 帧)的数据,为自动驾驶和机器人技术提供了强有力的支持。

DynamicCity 基于变分自编码器(VAE)将 4D 场景编码为紧凑的 HexPlane 表示,并使用基于扩散模型(DiT)的生成器重建动态场景。在 CarlaSC 和 Occ3D-Waymo 数据集上,DynamicCity 的表现显著优于现有方法,展现了其在高质量动态场景生成中的强大能力。

DynamicCity 的主要功能

  • 高质量 4D 场景生成:生成大规模、高质量的动态 LiDAR 场景,捕捉真实世界环境中动态变化的时空演变。
  • 多样化下游应用:支持轨迹引导生成、指令驱动生成、动态场景修复和布局条件生成等应用。
  • 动态场景修复(Inpainting):对部分缺失或损坏的场景进行修复,生成完整的动态场景。

DynamicCity 的技术原理

DynamicCity-pipeline

  • VAE 模型

    • 编码阶段:将 4D LiDAR 场景编码为紧凑的 HexPlane 表示,基于 3D 卷积神经网络提取特征,并用 Projection Module 将 4D 特征压缩为六个 2D 特征图。
    • 解码阶段:基于 Expansion & Squeeze Strategy (ESS) 并行解码 HexPlane,重建 3D 特征体积。
  • DiT 模型

    • HexPlane 生成:基于编码后的 HexPlane,DiT 模型用于生成新的 HexPlane,实现 4D LiDAR 场景的生成。提出 Padded Rollout Operation (PRO),将六个特征平面重新组织为一个方形 2D 特征图。
    • 条件生成:支持基于条件注入(如轨迹、指令、布局等)实现多样化的 4D 场景生成应用。

如何运行 DynamicCity

1. 安装环境

conda create -n dyncity python=3.10 -y
conda activate dyncity
conda install pytorch==2.4.0 pytorch-cuda=11.8 -c pytorch -c nvidia
conda install einops hydra-core matplotlib numpy omegaconf timm tqdm wandb -c conda-forge -y
pip install flash-attn --no-build-isolation
AI 代码解读

2. 数据准备

下载 CarlaSC 数据集并将其解压到 ./carlasc 目录中:

# 解压后目录结构如下:
DynamicCity
├── carlasc/
│   ├── Cartesian/
│   │   ├── Train/
│   │   │   ├── Town01_Heavy
│   │   │   ├── ...
│   │   ├── Test/
AI 代码解读

3. 训练与推理

训练 VAE 模型

torchrun --nproc-per-node 8 train.py VAE carlasc name=DYNAMIC_CITY_VAE
AI 代码解读

使用 VAE 模型生成 HexPlane

torchrun --nproc-per-node 8 infer_vae.py -n DYNAMIC_CITY_VAE --save_rollout --best
AI 代码解读

训练 DiT 模型

torchrun --nproc-per-node 8 train.py DiT carlasc name=DYNAMIC_CITY_DIT vae_name=DYNAMIC_CITY_VAE
AI 代码解读

使用 DiT 模型生成动态场景

torchrun --nproc-per-node 8 infer_dit.py -d DYNAMIC_CITY_DIT --best_vae
AI 代码解读

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

目录
打赏
0
1
1
0
402
分享
相关文章
揭秘8.3k star 开源神器 VoiceCraft 用AI革新有声内容创作,只需几秒录音
VoiceCraft 是一款开源语音编辑与文本转语音(TTS)工具,仅需几秒录音即可实现语音克隆、插入、删除、替换等操作,支持零样本编辑和高自然度语音生成。适用于播客、短视频、有声书等内容创作场景,具备本地部署能力,已在 GitHub 获得 8.3k 星标。
分享开源库:AI驱动的JavaScript反编译,针对混淆和压缩的代码
这是一个智能JavaScript反混淆与代码分析工具,通过AST转换和AI深度分析,自动还原变量名、识别依赖库、生成可视化控制流图,并支持多格式导出,提升代码理解与审计效率。访问 [jsunpack.tech](https://www.jsunpack.tech/) 即可在线体验。
121 0
企业AI落地开源五剑客:Open-WebUI、Dify、RAGFlow、FastGPT、n8n
在AI技术迅猛发展的今天,企业常面临数据安全、技术门槛和系统整合等难题。本文介绍了五款开源工具——Open WebUI、Dify、RAGFlow、FastGPT和n8n,它们以低成本、私有化部署和模块化扩展的优势,助力企业构建AI能力闭环,覆盖交互、生成、知识处理与流程自动化等多个环节,推动AI真正落地应用。
“上海有AI”,一座城市的智惠答卷
上海正以“智云上海”为核心,构建城市级AI中枢,推动人工智能从实验室走向街头巷尾,融入医疗、制造、交通等日常生活场景。在WAIC 2025上,上海展示了AI落地的广度与深度,从智慧社区到工业智能,AI已成城市“呼吸”的一部分。
这个开源的「AI + 低代码」开发平台绝了,Gitee上斩获 9.2K Star!
VTJ.PRO 是一款 AI 驱动的低代码开发平台,深度融合 Vue3 技术栈,支持可视化设计与源码级编辑双向自由切换。通过 AI 智能生成、代码修复、跨端输出等能力,大幅提升前端开发效率,实现设计即代码、代码即设计的高效工作流,适用于原型开发、项目重构等多种场景。平台完全开源,提供在线沙盒与本地部署,助力开发者兼顾开发速度与代码自由度。
110 0
阿里云正式开源 LoongSuite:打造 AI 时代的高性能低成本可观测采集套件
AI Agent技术架构的演进正在重塑软件工程实践方式。开发者可通过智能编程助手提升效率,也可依托专业框架构建智能体系统。技术生态呈现多维度发展,涵盖高代码与低代码方案,并支持Java和Python等多语言。新型开发范式如AutoGen和LangChain降低了开发门槛。LoongSuite作为可观测采集套件,助力企业高效构建AI时代可观测体系,推动标准化数据规范,提升系统稳定性与运维效率。
阿里云技术解决方案开放免费试用,热门AI场景免费体验!
阿里云推出免费试用计划,2025年7月起,新老用户均可领取100点试用点,用于部署体验技术解决方案。完成部署还可再获最高100点,相当于一年200元云资源免费用。支持AI、大数据、安全等多个领域,涵盖DeepSeek部署、模型微调等热门场景。点击链接即可领取,快速上手云上方案。
高校实验实训课程开发:基于现有的硬件基础和开源能力研发最前沿的AI实验课程
更多基于学校现有硬件基础:企业需求场景的开发和发展,更加注重上层数据和应用,各类工具软件的出现,极大提升了各类硬件的应用价值。我们看到各类硬件厂商,想方设法把硬件卖给学校,但是很多硬件不是在那里尘封,就是寥寥无几的使用场景,我们希望基于学校现有的硬件基础去开发更多面向不同行业或专业的实验实训课程,物尽其用。基于学校现有的硬件,集约开发,极大降低硬件投入成本。
67 7
GitHub爆款神器 | IOPaint:21.7k star 开源AI图像修复项目,竟能秒删水印、拓展画幅!
IOPaint 是一款由 Sanster 团队开发的开源图像处理工具,集成多种 SOTA AI 模型,支持图像擦除、对象替换、文本绘制和图像外扩等功能。它操作简便,一键安装,适用于 Windows、macOS、Linux 和 Apple Silicon 系统,适合摄影爱好者、电商从业者及内容创作者使用,大幅提升图像处理效率。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问