深度学习技术在自动驾驶中的应用与挑战

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 深度学习技术经过近几年井喷式的发展,在很多领域都得到了广泛的应用。在自动驾驶系统中,深度学习技术也起到了至关重要的作用,同时也面临着非常多的挑战。我们一直在探索,在一个安全、稳定的自动驾驶产品中,深度学习技术应该有着怎样的作用边界,又如何能最好地发挥其优势。本次分享的主题为深度学习技术在自动驾驶中的应用与挑战,

导读:深度学习技术经过近几年井喷式的发展,在很多领域都得到了广泛的应用。在自动驾驶系统中,深度学习技术也起到了至关重要的作用,同时也面临着非常多的挑战。我们一直在探索,在一个安全、稳定的自动驾驶产品中,深度学习技术应该有着怎样的作用边界,又如何能最好地发挥其优势。本次分享的主题为深度学习技术在自动驾驶中的应用与挑战,主要包括:

深度学习技术

端到端:从感知到控制

深度学习的特点

应用策略


01 深度学习技术

image.png

深度学习技术在2012年开始爆发,由AlexNet在ImageNet数据集上达到了一个很高的分类准确率,横扫各种CV、NLP任务,在强化学习领域也大展身手,尤其擅长玩游戏,比如deepmind最近在研究打星际争霸。右边是各种网络图,大家可以参考文末的链接。


02 端到端:从感知到控制

image.png

16年的时候,英伟达研究了end to end神经网络,左侧输入左中右三个Camera的image,直接通过CNN输出转向的指令。如demo截图中,测试人员把手伸出了天窗,表示他没有操控车辆,然后车辆自动实现转向。不过这种方式存在2个隐患:
① 因为是end to end 如果出现问题,完全不知道是哪里出了问题,很难去校正模型。
② 对于转向这个指令,需要考虑的因素非常多,一些微小的场景变化就会引发不同的转向指令(如路上多了一个石块),因此,必须覆盖到所有的情况,才可以把这个模型训练的非常好,这需要海量的数据。


03 深度学习的特点

优势:

自主挖掘数据中存在的特征和模式,大幅降低人工特征工程的需求
对于定义清晰的问题,有较强的可扩展性(加数据或数据增强)

局限性:

可解释性差,可能会“放飞自我”,不太可控
算力要求较高


04 应用策略

在要求很高稳定性和安全性的自动驾驶应用中,如何发挥深度学习的优势,以及规避深度学习的弱点,我们总结了几点应用策略,这里和大家分享下:

1. 尽量应用于定义清晰的基本任务

image.png

基本任务,是指只需要回答“是什么”或者“在哪”的任务。定义清晰,是指有明确的目标或者监督信息,在强化学习语境中,就是有明确的reward function。如CV中的目标检测、图像分割等。下面分享下应用实例:

① 图像中的车道检测

image.png

Demo点击原文查看

Demo是我们用分割模型做的Ego lane drivable area segmentation;上图右侧是我们做的instance level lane marker segmentation,网络结构如图所示,它是一个encoder decoder based,然后做一个segmentation branch和一个embedding branch,最后将2个结果合起来。

② 图像中的障碍物检测

image.png

上图是一些比较有挑战的场景:拥挤的路况、远处的障碍物、雨天、穿过高架桥等。障碍物检测比较成熟,这里不再细讲,常用的算法有:

Anchor based:YOLO v1,v2,v3/SSD/Faster RCNN
Anchor free:Centernet/FoveaBox

2. 多方法融合,弥补单一模型错误,覆盖长尾场景

image.png

在实际应用中,目标检测模型难免会产生误检和漏检,如左图中的皮卡和卡车很明显就被漏掉了。另外,对于训练集少见或没见过的特殊场景,深度神经网络往往无能为力,一旦出现这种情况,往往非常危险。对应的,我们的思路是:

① 结合其他任务模型,辅助降低漏检率
image.png

比如,有另外的一个模型可以识别出可行驶区域(也就是路,除了路以外的都是障碍物),再加上我们的目标检测,就可以对之前的案例进行弥补,如上图所示。

② 结合其他传感器,多传感器融合
image.png

另一种更常用,更安全的方法就是激光雷达,进行多传感器融合,如将激光雷达投影到image,可以很轻松的建模出可行驶的道路和障碍物。

3. 拆分任务,增加模型的可解释性和可控性

image.png

将end2end模型任务拆分成更加基本定义、更加清晰的多阶段子任务,增加整体任务的可解释性,减轻模型的学习负担。同时也更加方便地利用其他算法和规则对深度学习模型的输出结果做限制,防止其“放飞自我”。
① 自车行驶路径参考线:
image.png

我们在做Planning时,我们需要做一个自己车本身轨迹的参考线,以其为参考生成最终的轨迹,并且做一些速度的规划。如果我们没有高精地图,我们可能会采用E2E approach的方法,感知到一张图片之后利用deep CNN直接生成参考轨迹(如上图最右侧),这样单独的参考线通常是不能用的。所以我们需要把任务进行拆解。
image.png

拆解:

  • 车道识别+车辆跟踪:先识别车道再识别车
  • 利用车道与车辆信息拟合路径:把车道和车放入场景中,再利用车的朝向、轨迹、速度分布以及车道线的几何形状拟合出最终的路径参考线。

这是一个更可控的方案。

② 其他车辆轨迹预测
image.png

在学术界有一些E2E approach的方法,利用深度学习模型直接预测车辆轨迹,从过去的轨迹直接预测出未来的轨迹。
image.png

我们认为更好的方式,还是进行拆分:

  • 意图预测(横向、纵向),利用RNN、CNN先做一些意图预测(左转、右转或者直行),纵向就是匀速、加速或者减速,做这种简单的意图分类,将这个问题的维度缩小。
  • 然后,利用车辆(如动力学)模型、车道信息生成平滑预测轨迹。

最后,我们还在和机器一起学习成长。今天的分享就到这里,谢谢大家。


05 参考资料

  1. https://deepmind.com/blog/article/alphastar-mastering-real-time-strategy-game-starcraft-ii
  2. https://en.wikipedia.org/wiki/Deep_learning
  3. http://ml.world/2016/09/neural-network-zoo/
  4. End to End Learning for Self-Driving Cars
  5. Towards End-to-End Lane Detection: an Instance Segmentation Approach
  6. An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling

转载自公众号: DataFunTalk


阿里巴巴开源大数据技术团队成立Apache Spark中国技术社区,定期推送精彩案例,技术专家直播,问答区近万人Spark技术同学在线提问答疑,只为营造纯粹的Spark氛围,欢迎钉钉扫码加入!
image.png

对开源大数据和感兴趣的同学可以加小编微信(下图二维码,备注“进群”)进入技术交流微信群。

image.png

相关实践学习
基于EMR Serverless StarRocks一键玩转世界杯
基于StarRocks构建极速统一OLAP平台
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
27天前
|
机器学习/深度学习 传感器 数据采集
深度学习在故障检测中的应用:从理论到实践
深度学习在故障检测中的应用:从理论到实践
116 5
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习的原理与应用:开启智能时代的大门
深度学习的原理与应用:开启智能时代的大门
88 16
|
19天前
|
机器学习/深度学习 网络架构 计算机视觉
深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过研究卷积神经网络(CNN)的结构和原理,本文展示了深度学习如何提高图像识别的准确性和效率。同时,本文也讨论了数据不平衡、过拟合、计算资源限制等问题,并提出了相应的解决策略。
78 19
|
19天前
|
机器学习/深度学习 传感器 人工智能
探索深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文深入探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过介绍卷积神经网络(CNN)的基本原理和架构设计,阐述了深度学习如何有效地从图像数据中提取特征,并在多个领域实现突破性进展。同时,文章也指出了训练深度模型时常见的过拟合问题、数据不平衡以及计算资源需求高等挑战,并提出了相应的解决策略。
71 7
|
29天前
|
机器学习/深度学习 人工智能 算法
深度学习在图像识别中的革命性应用####
本文不采用传统摘要形式,直接以一段引人入胜的事实开头:想象一下,一台机器能够比人类更快速、更准确地识别出图片中的对象,这不再是科幻电影的情节,而是深度学习技术在图像识别领域带来的现实变革。通过构建复杂的神经网络模型,特别是卷积神经网络(CNN),计算机能够从海量数据中学习到丰富的视觉特征,从而实现对图像内容的高效理解和分类。本文将深入探讨深度学习如何改变图像识别的游戏规则,以及这一技术背后的原理、关键挑战与未来趋势。 ####
59 1
|
29天前
|
机器学习/深度学习 存储 人工智能
探索深度学习的奥秘:从理论到实践的技术感悟
本文深入探讨了深度学习技术的核心原理、发展历程以及在实际应用中的体验与挑战。不同于常规摘要,本文旨在通过作者个人的技术实践经历,为读者揭示深度学习领域的复杂性与魅力,同时提供一些实用的技术见解和解决策略。
30 0
|
29天前
|
机器学习/深度学习 自动驾驶 算法
深度学习在图像识别中的应用
本文将探讨深度学习技术在图像识别领域的应用。我们将介绍深度学习的基本原理,以及如何利用这些原理进行图像识别。我们将通过一个简单的代码示例来演示如何使用深度学习模型进行图像分类。最后,我们将讨论深度学习在图像识别领域的未来发展趋势和挑战。
|
29天前
|
机器学习/深度学习 数据采集 算法
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术在图像识别领域的应用,重点分析了卷积神经网络(CNN)的基本原理、优势以及面临的主要挑战。通过案例研究,展示了深度学习如何提高图像识别的准确性和效率,同时指出了数据质量、模型泛化能力和计算资源等关键因素对性能的影响。
|
29天前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用与挑战
本文深入探讨了深度学习技术在图像识别领域的应用及其面临的挑战。通过分析深度学习模型如卷积神经网络(CNN)的工作原理,我们揭示了这些模型如何有效地处理和识别图像数据。同时,文章也指出了当前深度学习在图像识别中遇到的一些主要问题,包括过拟合、数据集偏差和模型解释性等,为读者提供了对这一领域全面而深入的理解。
|
30天前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用与挑战
本文深入探讨了深度学习技术在图像识别领域的应用,分析了当前主流的深度学习模型及其在图像识别中的优势和面临的挑战。通过具体案例分析,揭示了深度学习如何推动图像识别技术的边界,并讨论了未来可能的发展方向。
43 4