自动驾驶中的循环神经网络(3)|学习笔记

简介: 快速学习自动驾驶中的循环神经网络(3)

开发者学堂课程【深度学习与自动驾驶:自动驾驶中的循环神经网络(3)】学习笔记与课程紧密联系,让用户快速学习知识

课程地址:https://developer.aliyun.com/learning/course/533/detail/7159


自动驾驶中的循环神经网络(3)


内容介绍

一、Application

二、Reminder:Original NVIDIA Approach to End-to-End Driving


一、Application

1、Application: Image Caption Generation

image.png

图片标题生成也是一样,你可以检测场景中的不同物体,生成物体

对应的单词把他们拼接成语法正确的句子,并且将这些句子排序第二和第三步都是LSTM来完成的,第一步是由计算机视觉来完成对物体的识将图片进行分割并检测物体,这样你就可以生成一个标题,例如“一位男士坐在沙发上,一条狗坐在他的大腿上”。

2、Application: Video Description Generation

image.png

同样的LSTM也可以应用于视频为视频生成标题输入每一帧都是图片,它们被输入LSTM,输入是图片,输出是一系列字符,首先加载图片,在上方你可以看到输出的结果,你将视频编码成网络中的一种表示,然后你产生与有关视频的单词,首先是输入层,其次是编码阶段,译码阶段,接受输入的视频比如一个人在说话之类的,由于输入和输出都是任意的,必须指明句子的开始和结束,在这个例子中是句子的结束,你想要知道什么时候结束,从而产生可法正确的句子,你也希望能够产生一个句号,来指明一个句子的结束。

3、Application: Modeling Attention Steering

image.png

循环神经网络,这里的 LSTM 控制滑动窗口在图片上的移动,用来对图片内容进行分类,这里,一个 CNN 被循环神经网络引导,将图片转换成一个房间号被称作视觉注意。

4、Application: Drawing with Selective Attention

image.png

视觉注意可以被用来引导,在感知方面,用来引导网络产生输出,在右边可以产生一张图片网络的输出,这是一个 LSTM,每一步的输出,都是可视的这样你可以画出数字。

5、Application: Adding Audio to Silent Film

image.png

将一个无声图片作为输入,也就是一系列图片,来产生相应的音频,这是一个LSTM,对于每一帧都有相应的卷积层,将每一帧图片作为输入产生将音频作为输出训练集是一个人用鼓槌击打物体,你的任务是给输入的无声视频产生鼓槌击打该物体所发出的声音。

6、Application: Medical Diagnosis

image.png

医学诊断,实际上,已经列举了一些应用非常成功的地方,非常酷,并且开始应用于一些可以真正帮助在医学应用方面帮助公民的地方。对于医学诊断,高度稀疏,不同长度的,信息序列,例如病人的电子病历,每次你看医生都会有一份检测并产生相应的信息,你可以把一段时间内的信息看作一个序列,将这些数据作为输入,输出是相应的诊断,一份医学诊断,在这种情况下,可以看看糖尿病,脊柱侧弯,哮喘等疾病的预测,具有相当不错的准确性。

7、Application: Stock Market Prediction

image.png

些东西,所有人都希望能做到,那是股市预测,你可以输入,比如,首先可以输入股票的原始数据,图书等财务数据,你也可以研究来自整个网络的新闻文章,并把这些作为输入,如图所示,x轴上是时间,文章是来自不同日期的,再次LSTM,可以并产生你所预测的输出,二元预测,股票是否会上涨或下跌,现在还没有人能够真成功地做到这一点但这里有一堆实验结果,并试图超过随机值,这是你如何赚钱的方法,明显高于随机值,在预测它正在上涨还是下跌,所以你可以买或卖,特别是当这里发生崩溃的情况下更容易预测所以你可以预测一个侵犯性的崩溃,这些显示在表中,不同的股票的失误率。

8、Application: Audio Generation

image.png

汽车股,你也可以生成音频,与生成语言的过程完全相同,这里是对它的训练单个扬声器几个小时他们讲述的史诗而你只是学习,这是演讲者的原始音频,而且它正在慢慢地学习生成显然他们正在读取数字,这是不可思议的,这是在原始音频的压缩频谱图训练,并正在生成一些东西只用段史诗就能产生听起来像文字的东西,这是原始的输入原始输出都是使用LSTM,在语音识别方面有很多工作,音频识别,你正在映射,你将任何类型的音频映射到分类,你可以用道路的音频,这就是底部的光谱图。

image.png

可以检测路是湿润的或者是干燥的,你可以对识别说话者的性别做同样的事情,或多对多的映射。

 

二、Reminder:Original NVIDIA Approach to End-to-End Driving

1、递归神经网络是如何用于驾驶的?

讲过NMDIA的方法,DeepTeslaJS实际上是基于它的,它是一个简单的卷积神经网络,有五个卷积层,在他们的方法中,有三个完全连接层,你可以在DeepTeslaJS中添加任意多层,这有25万个参数进行优化,你只需输入单个图像,没有时间信息,单个图像,并产生转向角度,这就是DeepTesla的方法

image.png

输入单个图像,并学习转向角度的回归,比赛的奖品之一是udacity的自动驾驶的纳米学位他们将要实现超越,利用卷积神经网络预测转同,输入一系列的图像然后预测转向,获胜者们做的是至少第一第二名的获胜者用的是维卷积神经网络,第名和第三名获奖者使用的是RNN,使用LSTMs递值神经网络,并映射一系列图像到一系列的转向角度

2、End-to- End Driving with RNNs

对任何人从统计学上来说在座往何不是做计算机视觉的人,论对什么应用,你最可能想用的,最感兴趣的是RNN,因为世界充满了时间序列数据很少人在做没有时间序列的数据的研究,实际上每当它只是快照,你只是将问题简化到可以处理的大小但大部分数据世界是时间序列的数据这是你最终使用的方法如果你想在自己的研究中应用它,RNN是一种选择

image.png

x: 3d convolution of image sequence

h: predicted steering angle, speed, torque

Sequence length: 10

再次它们在做什么?你怎么将图像输入一个递归神经网络,这是一样的,你拿你必须将图像转换成数字以某种方式,一个有效的方法就是卷积神经网络,所以你可以拿三维卷积神经网络或二维卷积神经网络,却决于你是否考虑时间处理这个图像,提取该图像的表征,这就变成了LSTM的输入,之后输出,在每一个单元每一个时间步骤中,是一个预测的转向角度,车辆的速度和扭矩,这就是第一位胜利者做的,他们不仅输出转向角,也输出速度和扭矩,至于他们使用的序列长度,用于训练和测试,用于输入和输出,是一个长度为10的序列。

(1)问题他们使用监督学习吗?还是他们使用强化学习

是的,DeepTesla给他们相同的东西,一系列帧对应一系列,转向角、速度和扭矩,还有其他的可用的信息,这里没有强化学习。

(2)问题你知道有多少信息被传输里面有多少LSTM

这个网络,这张图有些隐蔽,这里的参数,但是任意多的,就像卷积神经网络的参数是任意多的,输入的大小是任意的,Sigmoid 函数的大小,tanh 是任意的,所以你可以让它尽可能的大,尽可能的深,并且越深越大就越好,这些人实际使用了什么,这些比赛运作的方式,你在用LSTM,如果这是一对一映射,使用卷积神经网络,全连接网络,一些巧妙的预处理,整个的工作需要数月,可能如果你是一位研究人员,你的研究就是对参数进行处理,对数据进行预处理处理不同的控制网络大小的参数,学习率各类优化器,这些事情就是你所要处理的,用你自己的直觉,用任何可以一直检测网络性能的方法。(3)问题这个 LSTM 存在长度为10的记忆

RNN应该是任意的,这与训练有关网络是如何训练的,它用长度为10的序列进行训练,结构还是一样的,你只有一个单元,这是互相循环的,但是这里的问题就是,在哪块,在训练和测试中使用的序列长度是多少,它可以是任意长的,只是保持一致通常更好,并有一个固定长度,你没有把十个单元连在一起,只是一个单元。

image.png

Transfer learning: stacked CNN (pruned to 3000 features)

X: 3000 features extracted with CNN

h: predicted steering angle

Sequence length: 50

第三位冠军,Chauffeur队使用了转移学习,但它暗示了神经网络的神奇,首先你需要大量数据来做任何事情,这就是成本,是神经网络的局限性,但是你能做的是有在一个庞大的数据集上训练的神经网络,ImageNet、VggNet AlexNet ResNet,这些网络都是在巨大的数据量上训练的,那些网络被训练来分辨猫和狗的区别或具体图的视觉识别,然后怎样将这些网络运用到我的问题中,驾驶或道路检测或者医疗诊断,有没有得癌症或者医疗诊断,神经网络的美迁徒学习的承诺,可以用那个网络砍掉最后一层,全连接层它映射了那些,你在视觉空间里学到的高维特征,与判别猫和狗不同,你可以教他判断有没有癌症,你可以教他判断有没有车道,有没有卡车,只要网络工作的视觉空间与之相似,比如声音之类的如果与之相似,如果你学习的深入研究判别猫和狗的问题的特征是有用的,那么你已经学会了看这个世界,当你将要运用那些视觉知识的时候,你可以将知识迁移到另一个领域这就是神经网络优雅的力量,就是它是可迁移的,他们在这里所做的是,没有花足够的时间来看代码,我不确定他们拿了哪个巨大的神经网络,但是他们使用了一个巨大的卷积神经网络,他们砍掉了最后一层产生了3000个特征,他们利用每一帧的3000个特征,这就是xt,他们将它作为LSTM的输入,在那个情况下序列长度是50,那个过程在不同领域中,非常相似,这就是它的美,神经网络的艺术是超参数的调整,这就是棘手的部分,那是你无法学的部分,就是经验,可悲的是,这就是为什么他们叫随机梯度下降 SGD,Geoffrey Hinton,称它为随机毕业生下降,意味着你不断招毕业生来处理超参数,直到问题解决。

相关文章
|
24天前
|
存储 算法 网络虚拟化
【计算机网络】学习笔记,第三篇:数据链路层
现在的光纤宽带接入 FTTx 都要使用 PPPoE 的方式进行接入。在 PPPoE 弹出的窗口中键入在网络运营商购买的用户名和密码,就可以进行宽带上网了 利用 ADSL 进行宽带上网时,从用户个人电脑到家中的 ADSL 调制解调器之间,也是使用 RJ-45 和 5 类线(即以太网使用的网线)进行连接的,并且也是使用 PPPoE 弹出的窗口进行拨号连接的
28 5
|
4天前
|
机器学习/深度学习 数据采集 算法框架/工具
神经网络学习笔记(2)
神经网络学习笔记(2)
|
2月前
|
监控 Java 数据库连接
【后台开发】TinyWebser学习笔记(1)网络编程基础知识
【后台开发】TinyWebser学习笔记(1)网络编程基础知识
34 3
|
2月前
|
机器学习/深度学习 安全 自动驾驶
网络安全与信息安全:防御前线的科学与艺术基于深度学习的图像识别在自动驾驶技术中的应用
【5月更文挑战第27天】 在数字化时代,网络安全和信息安全已成为维护信息完整性、确保数据传输保密性和保障系统可用性的关键。本文深入探讨了网络安全漏洞的概念、加密技术的应用以及提升安全意识的重要性。通过对网络威胁的分析,提出了一系列创新的防护措施,旨在为读者提供全面的安全防护策略和技术应用指导。 【5月更文挑战第27天】 随着人工智能技术的飞速发展,深度学习已经成为推动许多创新应用的核心动力。尤其是在图像识别领域,深度学习模型已经展现出了超越传统算法的性能。本文将探讨深度学习在图像识别技术中的最新进展以及这些进展如何被应用于自动驾驶汽车系统中,以实现更准确和可靠的环境感知能力。我们将分析当前最
|
2月前
|
网络协议 Docker 容器
Ubantu docker学习笔记(七)容器网络
Ubantu docker学习笔记(七)容器网络
|
2月前
|
机器学习/深度学习 自动驾驶 安全
基于深度学习的图像识别技术在自动驾驶系统中的应用网络安全与信息安全:防御前线的关键技术与意识
【4月更文挑战第30天】随着人工智能技术的飞速发展,深度学习已成为推动多个技术领域革新的核心力量。特别是在图像识别领域,深度学习模型已展现出超越传统算法的性能。在自动驾驶系统中,准确的图像识别是确保行车安全和高效导航的基础。本文将探讨深度学习在自动驾驶中图像识别的应用,分析关键技术挑战,并提出未来的发展方向。
|
2月前
|
网络协议 网络架构 数据格式
计算机网络学习笔记(一)
OSI七层网络模型旨在支持异构网络互联,从下到上分别为物理层(传输比特流)、数据链路层(帧传输,如交换机)、网络层(IP数据包路由,如路由器)、传输层(TCP/UDP,端到端通信)、会话层(管理会话)、表示层(数据格式转换)和应用层(用户接口,如FTP, SMTP)。每一层负责不同的通信功能,并通过协议如PPP, IP, TCP等协同工作。
|
2月前
|
缓存 网络协议 开发者
计算机网络学习笔记(三)
TCP的异常终止使用reset报文,用于强制关闭连接,不等待正常四次挥手。RST标志位设置时,发送方直接丢弃缓存,接收方无需确认。常见情况包括:尝试连接服务器未开放的端口、一方异常崩溃、收到不属于现有连接的报文、超时未收到确认报文或应用开发者优化效率。reset报文帮助释放资源,防止连接挂起。
|
2月前
|
安全 数据安全/隐私保护
计算机网络学习笔记(四)
HTTPS流程涉及服务器的公钥/私钥和客户端随机密钥。首先,客户端向服务器443端口发起请求,服务器发送公钥给客户端。客户端验证公钥后生成随机密钥(client key),用公钥加密后发送回服务器。服务器用私钥解密获取client key,然后用它加密数据成密文传回客户端。客户端用client key解密完成安全传输。
|
2月前
|
域名解析 缓存 网络协议
【计算机网络基础篇】学习笔记系列之二《游览器输入URL后发生了什么?》
【计算机网络基础篇】学习笔记系列之二《游览器输入URL后发生了什么?》
45 3

热门文章

最新文章