生成式AI应用于自动驾驶:前沿与机遇

简介: 近期发表的一篇综述性论文总结了生成式AI在自动驾驶领域的应用进展,并探讨了自动驾驶与机器人、无人机等其它智能系统在生成式AI技术上的交叉融合趋势

激光雷达点云生成、驾驶视频生成、占用(Occupancy)生成、驾驶轨迹生成、....,生成式AI在自动驾驶的研发和应用中大有用武之处。近期发表的一篇综述性论文[1]以超过百页的篇幅介绍了生成式AI技术在自动驾驶领域的研究进展,并对其未来发展方向进行了展望。

Title.jpg

论文目录

Contents_1A.jpg

Contents_2A.jpg

Contents_3A.jpg

Contents_4A.jpg

部分插图

以下是该论文的部分插图。

Figure2_Top.jpg

自动驾驶汽车上主要传感器的典型位置[1]




Figure2_Bottom.jpg

自动驾驶汽车上传感器的覆盖和感知区域[1]




Figure4_lidar.jpg

激光雷达点云生成的方法和模型演进[1]




Figure4_occupancy.jpg

占用(Occupancy)生成的方法和模型演进[1]




Figure11.jpg

图像编辑示例:白天与夜景图像的转换;晴天与雨天图像的转换[2]

生成式AI的跨领域融合

上述论文[1]指出了自动驾驶领域与机器人、无人机等领域的部分共同之处,包括:

  • 都需要大量的视觉等传感器数据,用于训练和测试;
  • 都需要高度的安全性;
  • 都需要规划模型、推理引擎、协同机制等。

上述论文[1]还指出了自动驾驶与机器人、无人机等领域在生成式AI技术上的交叉融合趋势。

  • 在机器人领域有了VLA(视觉-语言-动作)模型之后不久,自动驾驶领域也出现了基于类似概念的EMMA和OpenEMMA模型;
  • 用于激光雷达点云生成的LidarDM模型既可用于自动驾驶领域,也可用于机器人领域;
  • 扩散(Diffusion)模型既可用于自动驾驶领域中的轨迹生成[4],也可用于机器人领域中的动作生成[5][6]。

挑战与机遇

上述论文[1]列举了自动驾驶中生成式AI目前所面临的若干挑战、以及若干科研和应用方向,例如:

  • 生成式AI的可信赖性——生成式AI可能会产生幻觉和错误输出,这对于自动驾驶来说是非常危险的;因此,Waymo等研发自动驾驶的公司在技术栈中采用了多层次的预防和纠正措施,包括采用多个冗余系统;
  • 人与生成式AI协同的可能性——(1)在自动驾驶的设计和测试中,工程师们可以为生成式AI制作示例、调整参数、以及指示AI生成特定的模拟场景(例如:生成行人在夜间暴雨中横穿马路的场景);反过来,生成式AI可以为工程师们的工作查错、生成脚本、配置实验、生成测试用例,发挥类似于AI编程助手的作用;(2)在自动驾驶的实际使用中,人与AI可以共同控制汽车:当遇到危险、并且车中的人没有做出反应时,AI可以像驾驶教练一样代替做出反应;当人觉得AI的驾驶过于激进时,可以接管驾驶,或者通过指示,改变AI的驾驶;
  • 无人机和低空经济——无人机与自动驾驶汽车所面临的问题有些是相似的,例如动态环境中的感知、导航、碰撞规避、障碍规避、与基础设施协同、与其它无人机或自动驾驶汽车协同等,这些问题都需要大量的数据、模型训练和模拟;无人机还面临其它的问题,例如:无人机的飞行轨迹是三维的,需要大量的三维环境数据(建筑物、树木、电磁地图等);无人机对于风等环境因素更加敏感,因此生成式AI还被用于生成微观天气数据,以模拟城市中的风对无人机安全性能的影响;在未来的低空经济中,无人机与自动驾驶汽车有望相互协同,形成多模态、可优化的交通体系,届时,生成式AI的应用前景将更加广阔。

参考文献

[1] Generative AI for Autonomous Driving: Frontiers and Opportunities

https://arxiv.org/abs/2505.08854

使用许可协议:CC BY

https://creativecommons.org/licenses/by/4.0/

[2] One-Step Image Translation with Text-to-Image Models

https://arxiv.org/abs/2403.12036

使用许可协议:CC BY

https://creativecommons.org/licenses/by/4.0/

[3] OpenVLA: An Open-Source Vision-Language-Action Model

https://arxiv.org/abs/2406.09246

使用许可协议:CC BY

https://creativecommons.org/licenses/by/4.0/

[4] MotionDiffuser: Controllable Multi-Agent Motion Prediction using Diffusion

https://arxiv.org/abs/2306.03083

[5] π_0: A Vision-Language-Action Flow Model for General Robot Control

https://arxiv.org/abs/2410.24164

[6] GR00T N1: An Open Foundation Model for Generalist Humanoid Robots

https://arxiv.org/abs/2503.14734


封面图:Timo Wielink、Unsplash

目录
相关文章
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
当无人机遇上Agentic AI:新的应用场景及挑战
本文简介了Agentic AI与AI Agents的不同、Agentic无人机的概念、应用场景、以及所面临的挑战
133 5
当无人机遇上Agentic AI:新的应用场景及挑战
|
2月前
|
开发框架 人工智能 Java
破茧成蝶:阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代
本文详细介绍了阿里云应用服务器如何助力传统J2EE应用实现智能化升级。文章分为三部分:第一部分阐述了传统J2EE应用在智能化转型中的痛点,如协议鸿沟、资源冲突和观测失明;第二部分展示了阿里云应用服务器的解决方案,包括兼容传统EJB容器与微服务架构、支持大模型即插即用及全景可观测性;第三部分则通过具体步骤说明如何基于EDAS开启J2EE应用的智能化进程,确保十年代码无需重写,轻松实现智能化跃迁。
309 40
|
2月前
|
人工智能 数据挖掘
🔔阿里云百炼智能体和工作流可以发布为组件了,AI应用变成“搭积木”
本文介绍了如何通过智能体组件化设计快速生成PPT。首先,创建一个“PPT大纲生成”智能体并发布为组件,该组件可根据用户输入生成结构清晰的大纲。接着,在新的智能体应用中调用此组件与MCP服务(如ChatPPT),实现从大纲到完整PPT的自动化生成。整个流程模块化、复用性强,显著降低AI开发门槛,提升效率。非技术人员也可轻松上手,满足多样化场景需求。
284 0
🔔阿里云百炼智能体和工作流可以发布为组件了,AI应用变成“搭积木”
|
2月前
|
人工智能 数据挖掘 大数据
“龟速”到“光速”?算力如何加速 AI 应用进入“快车道”
阿里云将联合英特尔、蚂蚁数字科技专家,带来“云端进化论”特别直播。
129 11
|
3月前
|
开发框架 人工智能 Java
破茧成蝶:传统J2EE应用无缝升级AI原生
本文探讨了技术挑战和解决方案,还提供了具体的实施步骤,旨在帮助企业顺利实现从传统应用到智能应用的过渡。
破茧成蝶:传统J2EE应用无缝升级AI原生
|
3月前
|
人工智能 开发框架 安全
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力,用户只需提交 npx 命令即可“零改造”将开源 MCP Server 部署到云上,函数计算 FC 会准备好计算资源,并以弹性、可靠的方式运行 MCP 服务,按实际调用时长和次数计费,欢迎你在阿里云百炼和函数计算 FC 上体验 MCP 服务。
356 30
|
2月前
|
数据采集 机器学习/深度学习 人工智能
代理IP:企业AI应用的隐形加速器与合规绞索
代理IP作为企业AI应用的重要基础设施,既是效率提升的加速器,也可能成为合规风险的来源。它通过技术演进重塑数据采集、模型训练与安全防护等核心环节,如智能路由、量子加密和边缘计算等创新方案显著优化性能。然而,全球法规(如GDPR)对数据流动提出严格要求,促使企业开发自动化合规审计系统应对挑战。未来,代理IP将向智能路由3.0、PaaS服务及量子网络方向发展,成为连接物理与数字世界的神经网络。企业在享受其带来的效率增益同时,需构建技术、法律与伦理三位一体的防护体系以规避风险。
68 0
|
3月前
|
数据采集 人工智能 大数据
演讲实录:中小企业如何快速构建AI应用?
AI时代飞速发展,大模型和AI的应用创新不断涌现,面对百花齐放的AI模型,阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台,解决企业开发难、部署繁、成本高等一系列问题,让中小企业快速搭建AI应用。
|
3月前
|
人工智能 搜索推荐 API
AI赋能大学计划·大模型技术与应用实战学生训练营——华东师范大学站圆满结营
4月24日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行大模型应用实战学生训练营——华东师范大学站圆满结营。
140 2
|
2月前
|
人工智能 Kubernetes 负载均衡
AI应用交付厂商F5打造六大解决方案,助用户应对复杂挑战
AI应用交付厂商F5打造六大解决方案,助用户应对复杂挑战
106 16

热门文章

最新文章