DynamicCity:上海AI Lab开源4D场景神器助力自动驾驶场景!128帧动态LiDAR生成,1:1还原城市早晚高峰

简介: DynamicCity 是上海 AI Lab 推出的 4D 动态场景生成框架,专注于生成具有语义信息的大规模动态 LiDAR 场景,适用于自动驾驶、机器人导航和交通流量分析等多种应用场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🛣️ “还在为自动驾驶测试犯愁?上海AI Lab放出4D场景核弹:128帧动态LiDAR生成,1:1还原城市早晚高峰!”
大家好,我是蚝油菜花。如果你正在经历——

  • 👉 斥资百万采集真实路测数据,雨天/夜间的极端场景仍难覆盖
  • 👉 模拟器的动态物体像‘纸片人’,导致感知模型泛化性差
  • 👉 场景重建工具只能处理静态环境,车辆轨迹全靠人工设计...

那么 DynamicCity 将是你的救星!这个由上海AI Lab研发的4D动态场景框架,基于 DiT+VAE融合架构,能生成80×80米大范围、128帧连续动态的LiDAR点云。更震撼的是,它支持 轨迹引导生成指令驱动控制 ——想象一下,用自然语言描述“早高峰十字路口突发急刹”,立刻获得带物理规律的4D场景数据!接下来我们将拆解其HexPlane黑科技,手把手教你在自动驾驶训练中落地应用。

🚀 快速阅读

DynamicCity 是一个强大的 4D 动态场景生成框架。

  1. 核心功能:生成大规模、高质量的动态 LiDAR 场景,支持轨迹引导、指令驱动等多样化应用。
  2. 技术原理:基于 VAE 和扩散模型(DiT),通过 HexPlane 表示和条件注入实现高效生成。

DynamicCity 是什么

DynamicCity

DynamicCity 是上海 AI Lab 推出的一个大规模动态场景生成框架,专注于生成具有语义信息的动态 LiDAR 场景。它能够处理大规模空间(80×80×6.4 m³)和长序列(最多 128 帧)的数据,为自动驾驶和机器人技术提供了强有力的支持。

DynamicCity 基于变分自编码器(VAE)将 4D 场景编码为紧凑的 HexPlane 表示,并使用基于扩散模型(DiT)的生成器重建动态场景。在 CarlaSC 和 Occ3D-Waymo 数据集上,DynamicCity 的表现显著优于现有方法,展现了其在高质量动态场景生成中的强大能力。

DynamicCity 的主要功能

  • 高质量 4D 场景生成:生成大规模、高质量的动态 LiDAR 场景,捕捉真实世界环境中动态变化的时空演变。
  • 多样化下游应用:支持轨迹引导生成、指令驱动生成、动态场景修复和布局条件生成等应用。
  • 动态场景修复(Inpainting):对部分缺失或损坏的场景进行修复,生成完整的动态场景。

DynamicCity 的技术原理

DynamicCity-pipeline

  • VAE 模型

    • 编码阶段:将 4D LiDAR 场景编码为紧凑的 HexPlane 表示,基于 3D 卷积神经网络提取特征,并用 Projection Module 将 4D 特征压缩为六个 2D 特征图。
    • 解码阶段:基于 Expansion & Squeeze Strategy (ESS) 并行解码 HexPlane,重建 3D 特征体积。
  • DiT 模型

    • HexPlane 生成:基于编码后的 HexPlane,DiT 模型用于生成新的 HexPlane,实现 4D LiDAR 场景的生成。提出 Padded Rollout Operation (PRO),将六个特征平面重新组织为一个方形 2D 特征图。
    • 条件生成:支持基于条件注入(如轨迹、指令、布局等)实现多样化的 4D 场景生成应用。

如何运行 DynamicCity

1. 安装环境

conda create -n dyncity python=3.10 -y
conda activate dyncity
conda install pytorch==2.4.0 pytorch-cuda=11.8 -c pytorch -c nvidia
conda install einops hydra-core matplotlib numpy omegaconf timm tqdm wandb -c conda-forge -y
pip install flash-attn --no-build-isolation

2. 数据准备

下载 CarlaSC 数据集并将其解压到 ./carlasc 目录中:

# 解压后目录结构如下:
DynamicCity
├── carlasc/
│   ├── Cartesian/
│   │   ├── Train/
│   │   │   ├── Town01_Heavy
│   │   │   ├── ...
│   │   ├── Test/

3. 训练与推理

训练 VAE 模型

torchrun --nproc-per-node 8 train.py VAE carlasc name=DYNAMIC_CITY_VAE

使用 VAE 模型生成 HexPlane

torchrun --nproc-per-node 8 infer_vae.py -n DYNAMIC_CITY_VAE --save_rollout --best

训练 DiT 模型

torchrun --nproc-per-node 8 train.py DiT carlasc name=DYNAMIC_CITY_DIT vae_name=DYNAMIC_CITY_VAE

使用 DiT 模型生成动态场景

torchrun --nproc-per-node 8 infer_dit.py -d DYNAMIC_CITY_DIT --best_vae

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
4月前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
4月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
5490 77
|
4月前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
437 5
我们开源了一款 AI 驱动的用户社区
|
4月前
|
人工智能 搜索推荐 UED
一个牛逼的国产AI自动化工具,开源了 !
AiPy是国产开源AI工具,结合大语言模型与Python,支持本地部署。用户只需用自然语言描述需求,即可自动生成并执行代码,轻松实现数据分析、清洗、可视化等任务,零基础也能玩转编程,被誉为程序员的智能助手。
|
4月前
|
传感器 人工智能 机器人
科技云报到:找到真场景,抓住真需求,这样的具身智能才是好AI
科技云报到:找到真场景,抓住真需求,这样的具身智能才是好AI
219 1
|
5月前
|
传感器 人工智能 监控
建筑施工安全 “智能防线”!AI 施工监测系统,全方位破解多场景隐患难题
AI施工监测系统通过多场景识别、智能联动与数据迭代,实现材料堆放、安全通道、用电、大型设备及人员行为的全场景智能监管。实时预警隐患,自动推送告警,联动现场处置,推动建筑安全从“人工巡查”迈向“主动防控”,全面提升施工安全管理水平。
973 15
|
5月前
|
人工智能 安全 架构师
开放、协同,2025 云栖大会“操作系统开源与 AI 进化分论坛”精彩回顾
唯有通过生态开放与技术共享,才能加速 AI 技术的普惠与产业化落地。
|
4月前
|
自然语言处理 数据挖掘 关系型数据库
ADB AI指标分析在广告营销场景的方案及应用
ADB Analytic Agent助力广告营销智能化,融合异动与归因分析,支持自然语言输入、多源数据对接及场景模板化,实现从数据获取到洞察报告的自动化生成,提升分析效率与精度,推动数据驱动决策。
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1004 51

热门文章

最新文章