为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生三篇论文被CVPR 2022收录

简介: 为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生三篇论文被CVPR 2022收录
人经常走一条路能走熟,自动驾驶汽车也应该能。


,时长03:17

自动驾驶汽车靠各种传感器「看到」这个世界,然后再借助人工神经网络处理来自传感器的数据。它们和人类不同,因为人类是有记忆的,一条路多走几次就熟了,但对于使用人工神经网络的自动驾驶汽车来说,这条路每天都是新的。这在天气恶劣时会成为一个问题,因为这种天气下,传感器往往没有那么可靠。



为了缓解这一问题,来自康奈尔大学 Ann S. Bowers 计算机与信息科学学院和工程学院的研究人员在 CVPR 2022 上发表了两篇研究论文,在ICLR 22上发表了一篇论文,其核心思想是为自动驾驶汽车创造「记忆」,并在后续的行驶中使用这些记忆。

论文 1 标题为「HINDSIGHT is 20/20: Leveraging Past Traversals to Aid 3D Perception」,一作是博士生游宇榕(Yurong You),senior author 是康奈尔大学 Bowers CIS 计算机科学教授 Kilian Weinberger。


论文链接:https://arxiv.org/pdf/2203.11405.pdf

Weinberger 教授认为,「上述问题的核心在于,我们能否从反复的经历中学习?例如,汽车的激光扫描仪第一次从远处看到形状奇怪的树时,可能会把它误认为行人,但一旦距离足够近,物体类别就变得清晰起来。因此,当你第二次开车经过同一棵树时,即使是在雾中或雪中,你也希望汽车已经学会正确识别这棵树。」

「事实上,你很少有机会开上一条近期完全没人开过的路,总有人最近会经过这里,所以,收集经验并加以利用看起来是再正常不过的事。」论文合著者 Katie Luo 说到。

在博士生 Carlos Diaz-Ruiz 的带领下,该小组在 18 个月的时间里驾驶一辆配置了激光雷达传感器的汽车在伊萨卡及其周围的 15 公里环路上重复行驶了 40 次,收集了沿途的环境(高速公路、城市、校园)、天气(晴天、雨天、下雪天)和一天中不同时段的信息。

这些信息组成了一个名为「Ithaca365」的数据集,其详细信息可在论文 2《Ithaca365: Dataset and Driving Perception under Repeated and Challenging Weather Conditions》中找到。


论文链接:https://openaccess.thecvf.com/content/CVPR2022/papers/Diaz-Ruiz_Ithaca365_Dataset_and_Driving_Perception_Under_Repeated_and_Challenging_Weather_CVPR_2022_paper.pdf


「这项研究直面自动驾驶汽车的一项关键挑战——恶劣的天气条件,」Ithaca365 的合著者 Diaz-Ruiz 说,「如果路面被积雪覆盖,人类可以依靠记忆,但人工神经网络无法依靠记忆,这就使其陷入劣势。」

论文 1 标题中的「HINDSIGHT」是一种在汽车经过物体时使用神经网络计算物体描述符的方法。然后,它会压缩这些被称为「SQuaSH (Spatial-Quantized Sparse History) 特征」的描述,并将其存储在虚拟地图上,类似于存储于人脑中的「记忆」。


下次穿越同一位置时,自动驾驶汽车可以查询沿途每个激光雷达点的本地 SQuaSH 数据库,并「回忆起」上次学习的内容。该数据库不断更新并在车辆间共享,从而丰富了可用于执行识别的信息。

「此信息可作为特征添加到任何基于激光雷达的 3D 目标检测器中,」游宇榕说,「检测器和 SQuaSH 表示可以在没有任何额外监督或人工注释的情况下被联合训练,后者需要花费不少时间和精力。」

虽然 HINDSIGHT 仍然假设人工神经网络已经经过训练,可以检测物体,并增加了创建记忆的能力,但论文 3《Learning to Detect Mobile Objects from LiDAR Scans Without Labels》又往前走了一步,提出了一种名为 MODEST(Mobile Object Detection with Ephemerality and Self-Training)的方法。


论文链接:https://openaccess.thecvf.com/content/CVPR2022/papers/You_Learning_To_Detect_Mobile_Objects_From_LiDAR_Scans_Without_Labels_CVPR_2022_paper.pdf


在这篇论文中,作者让自动驾驶汽车从头开始学习整个感知流程。最初,车辆中的人工神经网络从未接触过任何物体或街道。在对同一路径多次遍历之后,它可以了解到环境的哪些部分是静止的,哪些目标是移动的。慢慢地,它会教会自己什么是其他交通参与者,什么是可以忽略的安全因素。

然后,该算法可以可靠地检测这些目标,甚至在最初的重复遍历中不包括的道路上。

研究人员希望这两种方法都能大幅降低自动驾驶汽车的开发成本(目前仍严重依赖昂贵的人工标注数据),并通过学会在最常用的地点导航来提高这种汽车的效率。

论文 1 和论文 3 的一作均为康奈尔大学博士生游宇榕(他也参与了论文 2)。他本科毕业于上海交通大学致远学院 ACM 班,大二暑假加入卢策吾的实验室开始了对计算机视觉和增强学习的研究,并分别在大三暑假赴斯坦福大学 AI 实验室,大四暑假赴康奈尔大学进行相关领域的科研实习,之后获得康奈尔大学、加州理工学院计算机科学博士全奖录取。

最终,他选择了康奈尔大学攻读博士,师从该校计算机科学教授 Kilian Q. Weinberger 和计算机科学助理教授 Bharath Hariharan,重点研究计算机科学、机器学习等方向。


参考链接:https://news.cornell.edu/stories/2022/06/technology-helps-self-driving-cars-learn-own-memorieshttps://news.sjtu.edu.cn/ztzl_qczj/20180628/78193.html

相关文章
|
5天前
|
人工智能 计算机视觉 网络架构
OpenAI攻克扩散模型短板,清华校友路橙、宋飏合作最新论文
扩散模型在生成AI领域取得显著成果,但其训练不稳定性和采样速度慢限制了发展。OpenAI与清华校友合作,提出连续时间一致性模型(CMs),通过TrigFlow等创新解决了这些问题,大幅提升了训练稳定性和计算效率,实现了与最优模型相当的样本质量,同时减少了计算资源消耗。
14 2
|
3月前
|
机器学习/深度学习 人工智能
清华研究登Nature,首创全前向智能光计算训练架构,戴琼海、方璐领衔
【8月更文挑战第30天】清华大学研究人员在《自然》杂志上发表了一项开创性成果,提出了一种全前向智能光计算训练架构,解决了传统光学AI方法依赖电子计算机模拟和优化的问题,实现了光学系统的自学习和自设计。该架构通过将光学系统映射到参数化神经网络中,消除了反向传播需求,展示了在多个领域的广泛应用前景,如深度光学神经网络和高分辨率散射成像等。这一成果为光学AI的发展开辟了新道路,但实际应用中仍需克服一些挑战。论文详情见:https://www.nature.com/articles/s41586-024-07687-4
46 2
|
4月前
|
机器学习/深度学习 人工智能 算法
300多篇相关研究,复旦、南洋理工最新多模态图像编辑综述论文
【7月更文挑战第11天】复旦、南洋理工联合研究综述了多模态图像编辑,聚焦T2I扩散模型在融合多种输入模式、保持图像真实性和用户友好性方面的挑战与解决方案。论文探讨统一编辑框架,分析算法组件,指出技术进步及未来方向,同时警示伦理和社会影响。[链接:https://arxiv.org/abs/2406.14555]
51 1
|
5月前
|
人工智能 自然语言处理 测试技术
从高考到奥林匹克竞技场:大模型与人类智能的终极较量
【6月更文挑战第29天】上海交大等团队的OlympicArena测试评估了大模型在多学科认知推理任务上的能力,涵盖7个学科11,163个问题。最先进模型GPT-4的整体准确率为39.97%,数学和物理仅28.67%和29.71%,显示在复杂推理任务上的局限。尽管如此,模型在部分推理步骤中展现出潜力,但在空间推理和抽象符号理解上仍有挑战。[论文链接](https://arxiv.org/pdf/2406.12753)
37 1
|
机器学习/深度学习 人工智能 自然语言处理
ICML2023杰出论文大幅减少至6篇,北大、武理工校友获奖,大模型水印受青睐
ICML2023杰出论文大幅减少至6篇,北大、武理工校友获奖,大模型水印受青睐
100 0
ICML2023杰出论文大幅减少至6篇,北大、武理工校友获奖,大模型水印受青睐
|
存储 JSON 人工智能
送给大模型的「高考」卷:442人联名论文给大模型提出204个任务,谷歌领衔
送给大模型的「高考」卷:442人联名论文给大模型提出204个任务,谷歌领衔
168 0
送给大模型的「高考」卷:442人联名论文给大模型提出204个任务,谷歌领衔
|
机器学习/深度学习 算法
搞强化学习还不了解AutoRL,牛津大学、谷歌等十余位学者撰文综述
搞强化学习还不了解AutoRL,牛津大学、谷歌等十余位学者撰文综述
122 0
|
机器学习/深度学习 人工智能 数据可视化
Hinton的预言要实现了!美加顶尖大学Nature发文:全科医学人工智能GMAI不止要取代「放射科医生」(2)
Hinton的预言要实现了!美加顶尖大学Nature发文:全科医学人工智能GMAI不止要取代「放射科医生」
166 0
|
机器学习/深度学习 人工智能 数据可视化
Hinton的预言要实现了!美加顶尖大学Nature发文:全科医学人工智能GMAI不止要取代「放射科医生」(1)
Hinton的预言要实现了!美加顶尖大学Nature发文:全科医学人工智能GMAI不止要取代「放射科医生」
232 0
|
机器学习/深度学习 人工智能 自然语言处理
2020学术会议回顾:从这些最佳论文中一窥研究趋势
2020 年,是充满变化的一年。人工智能学术会议也不例外,线上举办、改革评审制度、增加可复现性要求、伦理要求等,这些是「变」。而不变的是大家对学术会议的热情,以及我们总能透过这些会议探究学术前沿发展趋势。
185 0
2020学术会议回顾:从这些最佳论文中一窥研究趋势