循环神经网络应用|深度学习(李宏毅)(六)

简介: 循环神经网络应用|深度学习(李宏毅)(六)

一、Many to one


  • 情感分析


  存在许多有标签的句子,将这些句子使用RNN读一遍,然后取RNN的最后一个输出作为预测情感的结果进行分类。

QQ图片20220531191323.png


  • 关键词提取


  使用RNN将多篇带有关键词标签的文章读一遍,然后把最后一个输出拿出来做attention,然后将结果放到前馈网络中去,最后输出文章的关键词。


QQ图片20220531191350.png



二、Many to Many


  • Many to Many (输出较短)


  在语音辨识中,可以将声音讯号(Acoustic Features)按照每一固定时间(如0.1s)划分为多个输入向量得到一个序列,然后使用RNN训练该序列,网络会输出RNN对应标签中的哪一个字。


QQ图片20220531191420.png


  但是这样网络仍然存在问题,网络无法区分“好棒”和“好棒棒”。CTC(Connectionist Temporal Classification)可以很好地解决这个问题,CTC添加了一个额外的符号“φ”来代表“null”,使用CTC进行识别的结果如下:


QQ图片20220531191456.png


  以下为使用CTC进行语音识别的一个例子:


QQ图片20220531191530.png


CTC进行语音识别的一个例子


  • Many to Many (输出长度无限制)


  这一部分指的是输入和输出都是序列,但是具有不同的长度(Sequence to sequence learning)。


  1. 机器翻译


  在机器翻译中,可以将一种语言的序列丢进RNN中,然后取RNN的最后一个输出当做输入继续训练,然后将每一个输出当做输入继续训练就可以得到另一种语言的一个序列:


QQ图片20220531191610.png


  1. 语法解析


QQ图片20220531191637.png


  1. 文本自编码器


  对文本的特征提取可以使用RNN来训练文本的自编码器,通过自编码器可以学习到文本的特征信息。自编码器的Encoder将一个句子中的词的词向量作为输入,然后将最后一个输出作为输入传入Decoder,使Decoder输出一个一模一样的句子出来,因此Encoder的输出就包含了句子的特征信息。


QQ图片20220531191710.png



  另外一个文本自编码器的例子是一个四层的LSTM,这个自编码器的Encoder将句子分别获得不同的向量,然后将得到的向量继续编码得到整个document的向量。自编码器的Decoder先将Encoder的输出还原成句子的向量,然后在继续Decode还原会原来的文本内容。


QQ图片20220531191733.png


  1. 语音自编码器


  RNN自编码器也可以使用语音信号作为输入,也就成为了语音自编码器,该网络可以将语音信号转换成固定长度的向量。在将编码得到的向量进行可视化以后可以看到具有相同或相似单词的声音讯号会距离比较近:


QQ图片20220531191859.png


  语音自编码器可以用来进行语音搜索、听歌识曲这样的工作,假如有一个语音数据库,可以将数据库中的语音数据划分为多个segment,然后编码这些数据的segment得到其编码向量,在进行搜索时就可以将搜索的声音讯号获得其编码向量来比较与数据库中数据的编码向量的相似度即可。其过程如下:


QQ图片20220531191926.png


  其网络结构如下:


QQ图片20220531191957.png


  经过自编码器编码的语音讯号通常具有一定的规律,比如在下图中将一个单词的“f”换成“n”会使得编码向量向同样的方向变化:


QQ图片20220531192025.png

  1. 聊天机器人


  使用RNN还可以用来做聊天机器人,RNN接收问题序列作为输入,输出对应的回答:


QQ图片20220531192050.png


三、Attention-based Model


  • Attention-based Model介绍


  除了RNN还有另一种使用记忆的模型叫做Attention-based Model,这个模型可以看做RNN的一种进阶版本。


  在Attention-based Model中,机器会存储“记忆”在memory中,当外界需要获取某些信息时机器会组织存储的记忆来给出对应的回答:


QQ图片20220531192125.png


  在该模型中会有一个DNN或者RNN作为中央处理器来接收输入并且根据输入来操纵一个Reading Head Controller,从而从机器的memory中获取对应的数据:


QQ图片20220531192153.png


  Attention-based Model还有一个进阶的版本,在这个模型中DNN或RNN还会操纵一个Writing Head Controller,从而可以实现将数据存储到对应的memory中,这个模型就是神经图灵机(Neural Turing Machine):


QQ图片20220531192218.png


  • 阅读理解(Reading Comprehension)


  Attention-based Model可以用来做阅读理解(Reading Comprehension),模型会将资料进行语义分析得到语义的向量,当一个Query输入到中央处理器中时,中央处理器就会多次移动探头获取相应的信息来进行响应:


QQ图片20220531192242.png


  • 图像问答(Visual Question Answering)


  训练数据中的图像会经过CNN得到对应的向量,当外界的Query输入到中央处理器中时,中央处理器就会多次移动探头获取相应的信息来回答输入的图像由什么组成的问题:


QQ图片20220531192840.png


  • 语音问答(Speech Question Answering)


  这部分的实验使用的是托福听力考试的资料,模型会将训练数据的语音进行语音识别然后对识别的结果进行语音分析得到memory中存储的记忆,模型也会对问题进行语义分析然后从memory中找到对应的答案:


QQ图片20220531192916.png


  下图实验结果中前五个是不使用神经网络的朴素方法,可以看到使用神经网络的方法得到的准确率是相对比较高的:


QQ图片20220531192937.png


相关文章
|
8天前
|
机器学习/深度学习 API 语音技术
|
7天前
|
机器学习/深度学习 算法 PyTorch
【动手学深度学习】深入浅出深度学习之线性神经网络
【动手学深度学习】深入浅出深度学习之线性神经网络
53 9
|
1天前
|
存储 监控 安全
网络安全与信息安全:防范漏洞、应用加密、提升意识
【4月更文挑战第18天】 在数字化时代,网络安全与信息安全保障已成为维护国家安全、企业利益和个人隐私的关键。本文深入探讨网络安全的多面性,包括识别和防御网络漏洞、应用加密技术保护数据以及提升全民网络安全意识的重要性。通过对这些关键领域的分析,文章旨在为读者提供实用的策略和建议,以增强其网络环境的安全防护能力。
4 0
|
1天前
|
机器学习/深度学习 数据可视化 测试技术
深度学习:Keras使用神经网络进行简单文本分类分析新闻组数据
深度学习:Keras使用神经网络进行简单文本分类分析新闻组数据
|
2天前
|
机器学习/深度学习 API 算法框架/工具
R语言深度学习:用keras神经网络回归模型预测时间序列数据
R语言深度学习:用keras神经网络回归模型预测时间序列数据
12 0
|
2天前
|
机器学习/深度学习 数据采集 TensorFlow
R语言KERAS深度学习CNN卷积神经网络分类识别手写数字图像数据(MNIST)
R语言KERAS深度学习CNN卷积神经网络分类识别手写数字图像数据(MNIST)
22 0
|
2天前
|
数据采集 机器学习/深度学习 数据挖掘
网络数据处理中的NumPy应用实战
【4月更文挑战第17天】本文介绍了NumPy在网络数据处理中的应用,包括数据预处理、流量分析和模式识别。通过使用NumPy进行数据清洗、格式化和聚合,以及处理时间序列数据和计算统计指标,可以有效进行流量分析和异常检测。此外,NumPy还支持相关性分析、周期性检测和聚类分析,助力模式识别。作为强大的科学计算库,NumPy在处理日益增长的网络数据中发挥着不可或缺的作用。
|
3天前
|
机器学习/深度学习 计算机视觉 异构计算
深度学习在图像识别中的应用与挑战
【4月更文挑战第16天】 随着人工智能技术的飞速发展,深度学习作为其核心技术之一,在图像识别领域取得了显著的成果。本文将探讨深度学习在图像识别中的应用,分析其优势和面临的挑战,并提出相应的解决方案。通过对现有技术的研究和实践,我们旨在为读者提供一个全面了解深度学习在图像识别领域的应用现状和未来发展趋势的视角。
|
3天前
|
机器学习/深度学习 监控 安全
深度学习驱动下的智能监控革新:图像识别技术的实战应用
【4月更文挑战第16天】 随着人工智能的迅猛发展,深度学习技术在图像处理和分析领域取得了突破性的进展。尤其是在智能监控系统中,基于深度学习的图像识别技术已经成为提高安全水平、实现自动化监控的关键工具。本文聚焦于深度学习在智能监控中的应用,探讨了卷积神经网络(CNN)、递归神经网络(RNN)等先进结构在实时视频流分析和异常行为检测方面的具体实践。通过深入分析多个案例,我们展示了深度学习如何提升监控系统的准确性、效率及智能化程度,同时对面临的挑战和未来发展趋势进行了展望。
6 2
|
5天前
|
机器学习/深度学习 安全 计算机视觉
深度学习在图像识别中的应用与挑战
【4月更文挑战第14天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉领域进步的关键力量。本文聚焦于深度学习技术在图像识别任务中的运用,探讨了卷积神经网络(CNN)的基本原理、关键架构以及优化策略,并对当前面临的主要挑战进行了分析。通过实验结果与案例分析,本文揭示了深度学习在提高图像识别准确性方面的潜力及存在的限制因素。