备案控制台

开发者社区机器之心文章正文

自动驾驶如何做到感知决策一体化？上海 AI Lab 自动驾驶团队分享最新成果

2023-05-16 256

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 自动驾驶如何做到感知决策一体化？上海 AI Lab 自动驾驶团队分享最新成果

自从1988 的 Alvinn 开始，端到端自动驾驶便进入了人们的视野，不同于模块化的自动驾驶方案，端到端的自动驾驶将传感器原始输入直接通过网络得到规划轨迹/控制信号。端到端自动驾驶模型结构简单，直接优化最终的驾驶信号，近年来吸引了诸多学术界和工业界的注意。

但现阶段的端到端自动驾驶也存在着很多问题，如先前基于 RL/IL 的一系列工作往往是在特征提取后简单直接输出控制信号，是一个黑盒模型，对系统的安全性形成重大挑战；大量工作关注于感知部分的传感器融合、特征提取，而忽略了如何在决策输出部分提高鲁棒性；当前工业界端到端模型实际应用落地时会遇到哪些困难等。

针对这些问题，上海人工智能实验室自动驾驶团队的研究员在感知决策一体化方面做了诸多研究，在论文《Trajectory-guided Control Prediction for End-to-end Autonomous Driving: A Simple yet Strong Baseline》中，提出了仅依靠单相机在 CARLA AD Leaderboard 上获得第一的方法 TCP，以及被 ECCV 2022 接收的论文《ST-P3: End-to-end Vision-based Autonomous Driving via Spatial-Temporal Feature Learning》中，提出的基于环视相机的具有中间特征可解释性的 ST-P3 框架等内容。

文章标签：

人工智能

传感器

网络协议

自动驾驶

关键词：

AI lab

AI决策

AI自动驾驶

AI感知

自动驾驶AI

-开发达人-

目录

相关文章

蚝油菜花

|

8天前

|

机器学习/深度学习人工智能算法

Enhance-A-Video：上海 AI Lab 推出视频生成质量增强算法，显著提升 AI 视频生成的真实度和细节表现

Enhance-A-Video 是由上海人工智能实验室、新加坡国立大学和德克萨斯大学奥斯汀分校联合推出的视频生成质量增强算法，能够显著提升视频的对比度、清晰度和细节真实性。

蚝油菜花

37 8 8

Enhance-A-Video：上海 AI Lab 推出视频生成质量增强算法，显著提升 AI 视频生成的真实度和细节表现

Echo_Wish

|

10天前

|

机器学习/深度学习数据采集人工智能

AI在用户行为分析中的应用：实现精准洞察与决策优化

AI在用户行为分析中的应用：实现精准洞察与决策优化

Echo_Wish

55 15 15

蚝油菜花

|

26天前

|

数据采集人工智能编解码

书生·万象InternVL 2.5：上海 AI Lab 开源的多模态大语言模型，超越了目前许多商业模型

书生·万象InternVL 2.5是由上海AI实验室OpenGVLab团队推出的开源多模态大语言模型系列。该模型在多模态理解基准（MMMU）上表现优异，超越了许多商业模型，适用于图像和视频分析、视觉问答、文档理解和多语言处理等多个领域。

蚝油菜花

82 7 7

书生·万象InternVL 2.5：上海 AI Lab 开源的多模态大语言模型，超越了目前许多商业模型

楠竹11

|

13天前

|

传感器人工智能安全

杨笛一团队：一个弹窗，就能把AI智能体操控电脑整懵了

杨笛一团队最新研究揭示，简单弹窗可操控AI智能体，使其在执行任务时陷入混乱。实验显示，在OSWorld和VisualWebArena环境中，攻击成功率分别达86%和60%以上。该发现强调了AI安全的重要性，提醒我们在享受AI便利的同时需警惕潜在风险。研究指出，弹窗设计中的四个关键要素（注意力钩子、指令、信息横幅、ALT描述符）对攻击成功至关重要，并建议通过安全训练、人类监督和环境感知提升防御能力。

楠竹11

42 13 13

蚝油菜花

|

1月前

|

人工智能 vr&ar

GeneMAN：上海AI Lab联合北大等高校推出的3D人体模型创建框架

GeneMAN是由上海AI实验室、北京大学、南洋理工大学和上海交通大学联合推出的3D人体模型创建框架。该框架能够从单张图片中生成高保真度的3D人体模型，适用于多种应用场景，如虚拟试衣、游戏和娱乐、增强现实和虚拟现实等。

蚝油菜花

63 7 7

GeneMAN：上海AI Lab联合北大等高校推出的3D人体模型创建框架

-编程工程师-

|

12天前

|

存储人工智能安全

微软推出Copilot Vision AI助手赋能网页浏览与决策

微软推出Copilot Vision AI助手赋能网页浏览与决策

-编程工程师-

29 2 2

Echo_Wish

|

22天前

|

传感器机器学习/深度学习人工智能

AI在自动驾驶汽车中的应用与未来展望

AI在自动驾驶汽车中的应用与未来展望

Echo_Wish

83 9 9

蚝油菜花

|

2月前

|

人工智能编解码 BI

LEOPARD：腾讯AI Lab西雅图实验室推出的视觉语言模型

LEOPARD是由腾讯AI Lab西雅图实验室推出的视觉语言模型，专为处理含有大量文本的多图像任务设计。该模型通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集，在多个基准测试中表现卓越，适用于自动化文档理解、教育和学术研究、商业智能和数据分析等多个应用场景。

蚝油菜花

42 2 2

LEOPARD：腾讯AI Lab西雅图实验室推出的视觉语言模型

阿里云云原生

|

1月前

|

人工智能

带上团队一起来做 AI 编程实践丨通义灵码联合TGO鲲鹏会开启 AI 大课

带上团队一起来做 AI 编程实践丨通义灵码联合TGO鲲鹏会开启 AI 大课

阿里云云原生

87 7 7

楠竹11

|

1月前

|

人工智能自然语言处理数据挖掘

田渊栋团队新作祭出Agent-as-a-Judge！AI智能体自我审判，成本暴跌97%

田渊栋团队提出Agent-as-a-Judge框架，利用智能体自身评估其他智能体的性能，不仅关注最终结果，还能提供中间反馈，更全面准确地反映智能体的真实能力。该框架在DevAI基准测试中表现出色，成本效益显著，为智能体的自我改进提供了有力支持。

楠竹11

47 7 7

热门文章

最新文章

一个模型走天下！智源提出全新扩散架构OmniGen，AI生图进入一键生成时代

预告 | 阿里云邀您参加2024中国生成式AI大会上海站，马上报名

通义千问开源的QwQ模型，一个会思考的AI，百炼邀您第一时间体验

12月更文特别场——寻找用云高手，分享云&AI实践

底层技术大揭秘！AI智能导购如何重塑购物体验

OpenAI 12天发布会全解析 | AI大咖说

加速数据处理与AI开发的利器：阿里云MaxFrame实验评测

教你自创工作流，赋予AI助理个性化推荐超能力

限时优惠体验！DataWorks数据治理中心全新升级为数据资产治理

阿里云百炼又获大奖！阿里云百炼入选 2024 最受开发者欢迎的 AI 应用开发平台榜15强

Fireworks AI和MongoDB：依托您的数据，借助优质模型，助力您开发高速AI应用

生成式AI入门必读：基本概念、数据挑战与解决方案

夏日主题 AI创造挑战活动来了！

[译][AI OpenAI-doc] 延迟优化

新一代数据库技术：融合AI的智能数据管理系统

AI回答总不满意？你的提问方式可能完全错误！

AI工具-标注工具labelme

[译][AI OpenAI-doc] 安全最佳实践

构建高效AI系统：深度学习优化技术解析

构建未来：AI在持续学习系统中的创新应用

相关课程

更多

AIGC无处不在，把AI应用构建于Serverless之上

【科技少年】AI领航员探索教程（赛前训练）

达摩院视觉AI精品课

AI开发者的Docker实践

趣味视觉AI应用入门与实战

AI数学基础

相关电子书

更多

Lindorm：打造AI时代的一体化数据平台

Lindorm AI 能力介绍

2023云栖大会：PolarDB for AI

相关实验场景

更多

体育赛事！零代码生成运动风格AI写真。

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

使用容器计算服务 ACS 算力快速搭建生成式 AI 会话应用

SAE 极速部署专属 AI 证件照神器

流水线运行出错排查难？AI帮你智能排查

以电商场景为例搭建AI语义搜索应用

下一篇

DataWorks智能交互式数据开发与分析之旅