自动驾驶中的卷积神经网络(2)|学习笔记

简介: 快速学习自动驾驶中的卷积神经网络(2)

开发者学堂课程【深度学习与自动驾驶:自动驾驶中的卷积神经网络(2)】学习笔记与课程紧密联系,让用户快速学习知识

课程地址https://developer.aliyun.com/learning/course/533/detail/7155


自动驾驶中的卷积神经网络(2)

 

内容介绍

、ConvNets

、How Can Convolutional Neural Networks Help Us Drive?

 

内容简介

一、ConvNets

1、ConvNets: Spatial Arrangement of Output Volume

image.png

使输入和输出有相同高度和宽度。所以这是一个卷积的可视化。

image.png

这与人类视觉的工作方式非常相似这里左边的输入是一个数字的集合:0,1,2,一个过滤器或者有两个过滤器显示为W1-WO和W1。以红色显示的那些过滤器是在这些过滤器中应用的不同权重。而且每个过滤器都有一定的深度输入深度3,每列有三个,所以你沿着图像滑动过滤器保持权重相同,这是权重的共享。所以第一个过滤器选择权重这是一个优化问题用这种方式选择权重,对于有用的特征它会被激活并且不会因没有用的特征而激发。然后还有第二个过滤器会由有用的特征触发,并根据一个正数产生一个输出信号,这意味着该区域有一个明显的特征,如果没有特征就产生一个负数。但过滤器是相同的。这可以大大减少参数,所以你可以处理输入,例如。1000*1000像素的图像或视频。

2、ConvNets: Pooling

 image.png

(1)这有一个非常重要的概念。即权重的空间共享,这意味着在检测的特征具有空间不变性。它允许你从任意图像学习,所以你不必担心要用什么更巧妙的方式预处理图像,你只是给出原始的图像。这还有另外一个操作:池化。例如在这种情况下,这是一种减小图层大小的方法,它是最大池化因为它是输出的集合,选择x1,并总结这些像素的集合。使得池化操作的输出远小于输入。因为不需要高分辨率。分辨哪个像素在图像中是重要的,不需要确切知道哪个像素与猫耳朵或猫脸相关联。只要你知道它就在那一边就行。这也减少了操作的复杂性。

(2)问题:什么时候会造成池化过度。什么时候应该停止池化?

池化是一个非常粗糙的操作需要知道的是它没有任何可以学习的参数。所以不能很好的学习任何关于池化的东西,在这种情况下,只是选择最大池化,选择最大的数字减少了分辨率也失去了很多信息,有人认为只要你没有将整张图片池化为一个单的值就不会丢失太多信息,但是你获得了训练效率减少存储所需空间减小了网络的规模,所以这容易引起争议它是一个参数你可以修改它看看哪些值起作用。

3、Computer Vision: Object Recognition / Classification

结合起来一个卷积神经网络输入是一幅图像通常有一个卷积层然后是一次池化操作接着是另一个卷积层再一次的池化操作以此重复最后如果任务是分类就会得到一堆的卷积层和池化层有几个全连接层,你从空间卷积运算开始把一层中的每一个神经元连接到下一层,这样最终你会拥有一组神经元每个神经元都与一个特定的类相关联,输入图像每张图是一个0到9之一的数字,这里输出是10个神经元经过这些卷积层的处理,在最后,用1或2或3个全连接层生成了10个神经元,每个神经元的工作是,当它看到一个特定的数字时被激活而看到其他的数字的则产生一个低概率,这是在CIFAR-10问题上获得95%的准确率的原因

image.png

这就是mageNet数据集图片包括一只美洲豹或一艘集装箱船,可以产生这张图片是集装箱船的概率或者是美洲豹的概率,同时也显示了邻近神经元的输出及其概率。

4、Computer Vision:Segmentation

image.png

可以通过在最后去掉全连接层来使用相同的运算,与从图像映射到图像中包含的信息的预测相反你从这张图片映射到另一张图片,而且你可以训练使得那张图片成为一张具有激发能力的图片,空间上这意味着它给包含感兴趣的对象的区域一个接近1的数,给不太可能包含图像的区域一个较低数值,所以,可以从左边开始从一张骑着马的女人的原始图片到一张分割轮廓图。

5、Computer Vision:Object Detection

同样的过程可以用来识别物体,所以你可以将场景分割为,一些感兴趣的物体感兴趣的候选对象然后逐个处理这些候选对象,并且进行类似上一步的分类输入图片输出类别。

image.png

通过遍历图片可以找到精确地划分出图片里的一头牛的最好的方法,这就是物体识别。

 

二、How Can Convolutional Neural Networks Help Us Drive?

这些神奇的卷积神经网络是怎样帮助我们驾驶的?

image.png

这是汽车道路前进,它来自于特斯拉车辆收集的数据但是先来看驾驶。

1、Driving: The Numbers

(in United States, in 2014)

(1)Miles

① All drivers: 10,658 miles(29.2 miles per day)

② Rural drivers: 12,264 miles

③ Urban drivers: 9, 709 miles

(2)Fatalities

① Fatal crashes: 29, ,989

② All fatalities: 32,675

③ Car occupants: 12,507

④ SUV occupants: 8,320

⑤ Pedestrians: 4 884

⑥ Motorcycle: 4,295

⑦ Bicyclists: 720

⑧ Large trucks: 587

来看一般的驾驶任务从人的角度一名美国司机平均每年驾驶10,000英里。在乡村这个距离会多一点在城市里会少一点,每年大约有30000起重大车祸,多达32000甚至38000人丧生,这些人包括车内乘员行人骑自行车的人以及骑摩托车的人。

image.png

这可能是一个令人惊讶的事实但是在自动驾驶的课堂上我们应该记住

image.png

除了被归类为“其他”的59.9%在美国最受欢迎的车是皮卡包括福特F-1系列,以发雪佛兰Silverado和Ram重要的一点是想要有掌控权看到的这些有趣的车中的一辆,上课用的数据集就是来自特斯拉的汽车,它是一辆介福特F-150与小巧的谷歌无人车之间的车型,它很快,它让你体验到驾驭的感觉,但是如果需要,它也可以在高速路上自动驾驶几百英里。

2Human at the Center of Automation:The Way to Full Autonomy Includes the Human

(1)Emergency

Automatic emergency breaking (AEB

(2)Warnings

Lane departure warning (LDW)

Forward collision warning (FCW)

Blind spot detection

(4)Longitudinal

Adaptive cruise control (ACC)

(5)Lateral

Lane keep assist (LKA)

Automatic steering

(6)Control and Planning

Automatic lane change

Automatic parking

你仅按一个键就可以切换到自动驾驶,这种切换是一种令人着迷的权衡将操控从人转移到汽车,这是一种对信任的转变,而且当人与时速超过60英里的汽车联系在一起时,这是研究人类心理的一个机会。

3、Distracted Humans

(1)What is distracted driving?

① Texting

② Using a smartphone

③ Eating and drinking

④ Talking to passengers

⑤ Grooming

⑥ Reading, including maps

⑦ Using a navigation system

⑧ Watching a video

⑨ Adjusting a radio

(2)Injuries and fatalities

3,179 people were killed and 431,000 were injured in motor vehicle crashes involving distracted drivers

(in 2014)

(3)Texts:

169.3 billion text messages were sent in the US every month.

(as of December 2014)

(4)Eye off road:

5 seconds is the average time your eyes are off the road while texting. When traveling at 55mph, that's enough time to cover the length of a football field blindfolded.

这里有一些让人类分心的事,比如,使用智能手机打字,看视频,梳妆打扮与乘客交谈,吃东西喝东西发短信,2014年,在美国每月有1690亿条短信被发送,平均来说,当发短信时视线会离开道路5秒钟,这就是自动化驾驶的机遇。

4、4 D's of Being Human: Drunk, Drugged, Distracted, Drowsy

(1) Drunk Driving: In 2014, 31 percent of traffic fatalities

involved a drunk driver,

(2) Drugged Driving: 23% of night-time drivers tested positive for illegal, prescription or over-the-counter medications.

(3) Distracted Driving: In 2014, 3,179 people (10 percent of

overall traffic fatalities) were killed in crashes involving distracted drivers.

(4) Drowsy Driving: In 2014, nearly three percent of all traffic fatalities involved a drowsy driver, and at least 846 people were killed in crashes involving a drowsy driver.

NHTSA将其称为4个D:醉酒、吸毒、走神、疲劳,这4个中的每一个都是引进自动驾驶的机遇。对醉酒驾车的改善也许最大。

5、In Context: Traffic Fatalities

(1)Total miles driven in U.S. in 2014:

3,000,000,000,000 (3 million million)

Fatalities: 32,675(1 in 90 million)

(2)Tesla Autopilot miles driven since October 2015:

300,000,000 (300 million)

(as of December 2016)

Fatalities: 1

然后是里程,数据上面,每年有3万亿英里的驾驶,再看TESLA的自动驾驶仪,这门课的研究实例,全自动驾驶模式开启,截至2016年十二月,共驾驶了3亿英里,由人控制的车辆造成的车祸死亡比例为1:90,000,000,每年有大于3万车祸死亡的人,而目前TESLA自动驾驶的汽车仅有一例车祸死亡的事件有许多的方法可以来统计目前,也许自动化可以使得驾驶更加安全。问题是:并不理解自动化,因为没有数据,没有汽车驾驶时前方道路的录像,也没有驾驶员的数据,自动驾驶上路的车还不够。因此需要许多的数据,收集了大量数据用于MIT研究,关于车辆自动驾驶的数据这些收集到的数据有助于去理解它。

6、The Data

这些数据,它们将用于训练算法这是TESLAModelS和ModelX,检测了17组数据收集到的这些数据超过了5000小时、70,000英里

image.png

关于放在里头的摄像机。收集前方道路的录像。这是一个人驾驶着TESLA从Boston到Florida的行程。蓝色部分所展示的是自动驾驶仪工作的时间,目前是0分钟并且之后会一直增长,对于一个持续了很久的上百英里的路程,人们使用自动驾驶仪,TESLA总行驶里程数13亿英里,3亿英里是靠自动驾驶仪占其中的25%,收集前方道路以及驾驶员的数据,有两个用来观察驾驶员的摄像头

7、Camera and Lens Selection

 image.png

用来记录的摄像机是常规的网络摄像机,计算机视觉领域的常用设备C920,在它上面还有一些特殊的镜头,那么这些网络摄像机的特殊之处在哪里呢没有什么东西只卖$70还像它那么好,他们的特殊之处在于,他们可以压缩数据,因此可以收集大量的数据,他们可以使用合理的存储空间来储存数据并训练算法。

8、Semi-Autonomous Vehicle Components

(1)External

① Radar

② Visible-light camera

③ LIDAR

④ Infrared camera

⑤ Stereo vision

⑥ GPS/IMU

⑦ CAN

⑧ Audio

(2)Internal

① Visible-light camera

② Infrared camera

③ Audio

在自动驾驶方面需要做什么呢如何一辆自动驾驶的汽车呢?需要雷达传感器、激光雷达传感器、视觉传感器、声音信号传感器,朝向外部,帮助检测外部环境的物体定位等等,还有面向内部的传感器:可见光相机、声音信号传感器、红外摄像机。

9、Self-Driving Car Tasks

(1)Localization and Mapping:

Where am l?

(2)Scene Understanding:

Where is everyone else?

(3)Movement Planning:

How do I get from A to B?

(4)Driver State:

What's the driver up to?

可以分解自动驾驶汽车的任务为4个步骤:定位、回答我在哪里、场景理解、以及,使用场景周边的信息结构来解释场景内的不同对象的身份,以及他们的语意和动作,还有路线计划,一旦搞清楚所有事情,找到所有的行人和其他的车辆,如何在迷宫里进行导航呢,如何安全且合法的穿过这些话七八糟的物品,这是关于驾驶员的状态,如何检测使用的录像以及其它的信息呢?驾驶员的录像检测了他们的情绪状态的信息以及分心的程度。

这就是激光雷达的实时数字,激光雷达是为你提供3D点云的传感器,因此激光雷达是一种科技,大多数自动驾驶汽车都用激光雷达来为人们提供强大的地面实况,这可能是拥有的最好的传感器,通过它获得外部环境噪声最小的3D信息。

image.png

自动驾驶仪总是在改变,最棒的事情之一就是只用更新软件,可自动驾驶时间的越来越少,但是在这里,在这个早期的版本,他展示了第二行是黄色的,展示了自动驾驶仪什么时候是可用的但是并没有开启,因此总的驾驶时间是10小时,自动驾驶仪有7个小时是可用的并且有一个小时处在工作状态,这个人是一个负责任的驾驶员或者说他是个细心的驾驶员,因为目前正在下雨,自动驾驶仪仍然处于可用的状态

不能以死亡的人数作为安全性的标志,因为驾驶员仅仅当它是安全的时候才会去使用这个系统它是完全开放的,关于这个数字仍存在着很多争议,关键是否认为它是个不好的事物,因此可能会相信人类和它的互动,不管是 YouTube 视频还是媒体天花乱坠的宣传,你仍然是一个人类,驾驶着每小时移动60英里的金属盒子,你的生命都寄托在上面,除非你知道它是完全安全的或者你十分信任这个系统,不然你不会使用它,这还并不是全部你还能看到一个人在后座开始睡觉或者下棋事实是只要在车里,你的生命就悬系于车上而你要为此负责,不管是在什么样的车上

提问你需要看到什么或者感知到什么才能安全驾驶是看到划线还是什么在定位和导航的时候依据什么

这取决传感器,加州运行的谷歌无人车,使用高分辨率激光雷达为周围环境制作地图,激光雷达有个弱点,虽然不确切知道原因,就是在雨中和雪中表现不佳,在环境改变时表现不佳,环境的视觉反光特征改变的时候,人类仍然可以辨别,但是依靠激光雷达定位的车辆就没办法,因为地标的长相变了,计算机视觉帮助识别交通标志线,或跟随一辆车,规则是跟随前方的车辆,以及保持在两条线之间,道路是为人眼设计的,这很好,可以用计算机视觉去做同样的事,同时有雷达,很原始,但是,是距离信息的可靠来源,使你不至于撞上金属物体,一切取决于你依赖什么获取信息,但当你进入真实世界会发生各种情况,这些方法是否依然靠谱,回到定位问题,深度学习的作用。

相关文章
|
5天前
|
机器学习/深度学习 计算机视觉 Python
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力本文提出了一种简单且高效的卷积神经网络(ConvNets)注意力模块——SimAM。与现有模块不同,SimAM通过优化能量函数推断特征图的3D注意力权重,无需添加额外参数。SimAM基于空间抑制理论设计,通过简单的解决方案实现高效计算,提升卷积神经网络的表征能力。代码已在Pytorch-SimAM开源。
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
|
8天前
|
机器学习/深度学习 监控 自动驾驶
卷积神经网络有什么应用场景
【10月更文挑战第23天】卷积神经网络有什么应用场景
12 2
|
8天前
|
机器学习/深度学习 自然语言处理 算法
什么是卷积神经网络
【10月更文挑战第23天】什么是卷积神经网络
16 1
|
11天前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
33 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
13天前
|
机器学习/深度学习 人工智能 自动驾驶
深度学习中的卷积神经网络(CNN)及其应用
【10月更文挑战第21天】本文旨在深入探讨深度学习领域的核心组成部分——卷积神经网络(CNN)。通过分析CNN的基本结构、工作原理以及在图像识别、语音处理等领域的广泛应用,我们不仅能够理解其背后的技术原理,还能把握其在现实世界问题解决中的强大能力。文章将用浅显的语言和生动的例子带领读者一步步走进CNN的世界,揭示这一技术如何改变我们的生活和工作方式。
|
2天前
|
机器学习/深度学习 人工智能 TensorFlow
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【10月更文挑战第32天】本文将介绍深度学习中的一个重要分支——卷积神经网络(CNN),以及其在图像识别领域的应用。我们将通过一个简单的代码示例,展示如何使用Python和TensorFlow库构建一个基本的CNN模型,并对其进行训练和测试。
|
7天前
|
机器学习/深度学习 自然语言处理 TensorFlow
深度学习中的卷积神经网络(CNN)及其应用
【10月更文挑战第26天】在这篇文章中,我们将深入探讨卷积神经网络(CNN)的基本原理、结构和应用。CNN是深度学习领域的一个重要分支,广泛应用于图像识别、语音处理等领域。我们将通过代码示例和实际应用案例,帮助读者更好地理解CNN的概念和应用。
|
10天前
|
机器学习/深度学习 算法 计算机视觉
深度学习与生活:如何利用卷积神经网络识别日常物品
【10月更文挑战第24天】在这篇文章中,我们将探索深度学习如何从理论走向实践,特别是卷积神经网络(CNN)在图像识别中的应用。通过一个简单的示例,我们将了解如何使用CNN来识别日常生活中的物体,如水果和家具。这不仅是对深度学习概念的一次直观体验,也是对技术如何融入日常生活的一次深刻反思。文章将引导读者思考技术背后的哲理,以及它如何影响我们的生活和思维方式。
|
15天前
|
机器学习/深度学习 人工智能 自动驾驶
深入理解深度学习中的卷积神经网络(CNN)
【10月更文挑战第18天】深入理解深度学习中的卷积神经网络(CNN)
26 0
|
18天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于贝叶斯优化卷积神经网络(Bayes-CNN)的多因子数据分类识别算法matlab仿真
本项目展示了贝叶斯优化在CNN中的应用,包括优化过程、训练与识别效果对比,以及标准CNN的识别结果。使用Matlab2022a开发,提供完整代码及视频教程。贝叶斯优化通过构建代理模型指导超参数优化,显著提升模型性能,适用于复杂数据分类任务。