【paddle深度学习高层API七日打卡营】三岁水课第五天——新春对联

简介: 【paddle深度学习高层API七日打卡营】三岁水课第五天——新春对联

大家好,这里是三岁,别的不会,擅长白话,今天就是我们的白话系列,内容是paddle2.0新出的高程API,在这里的七日打卡营0基础学习,emmm我这个负基础的也来凑凑热闹,那么就开始吧~~~~

注:以下白话内容为个人理解,如有不同看法和观点及不对的地方欢迎大家批评指正!


课程传送门


基本概念



20210208132631111.png


课程目标



20210208132743518.png


文本生成任务



20210208132837957.png


seq2seq



数据经过编码器编码然后到解码器进行解码最后得到以后输出


在里面是一个位置一个位置输出,而不是一起一次性输出

然后他可以将任意长度的原序列转换成另一个任意长度的目标序列

里面编码器和解码器基本上用的是RNN的单元


20210208132942580.png


编码器和解码器的缺点就是无法充分利用输入序列的信息这个时候就会引入一个新的机制——attention


20210208133539207.png


attention机制(权重)



20210208134119994.png



20210208134427100.png


数据处理


  • 输入一个数据:进行切词然后对照着我们的词汇表对每个词的ID进行查找(ID相当于我们的身份证号码是词汇的唯一标识)
  • 然后利用数组把这句话进行表示(表示的方式:词汇表的长度在id位置处显示为1其他均为0)也就是这个数组的大小为句子的长度 * 词汇表的长度
  • 数组和已经准备好的字典(这个需要通过其他方式进行学习)进行乘积得到一个新的表示数值
  • 一定数量的文本组成一个三维的数据去共同进行处理
  • 三维数据经过LSTM得到了一个降维以后的词向量


image.png


长短时记忆网络(LSTM)


20210208142220359.png


nn.LSTM的输出


该网络逐个词进行输入,前一个时刻输入的内容会对下一个时刻产生一定的影响,这样子可以对一些比较长的句子进行解析,内部也存在一定的记忆


20210208142514265.png


里面X是输入:是一个随机函数,作用:随机初始化一个(128,20,64)的矩阵


128:128个样本同时处理

20:统一的长度20

64:词向量的维度是64

rnn_madelpaddle.nn.LSTM()初始化的一个结果

然后把x输入网络rnn_madel得到y(h,c)h,c分别代表网络里面的记忆信号和输出信号。y是每个时刻的输出信号


20210208143037391.png


注意力机制(Attention)



逐个输入数据在编码和解码的同时通过训练会得到一个权重,那个词语比较重要最后的权重也会进行一个偏移,整个过程中会更加重视这个词的内容以及对后面的影响。


20210208144802475.png

20210208150718602.png


项目实战



数据


20210208152917961.png20210208152932792.png


通过paddlenlp.datasets.CoupletDataset.get_datasets()对数据进行读取


train_ds, dev_ds, test_ds = CoupletDataset.get_datasets(['train', 'dev', 'test'])


# 查看代码读取情况
print (len(train_ds), len(test_ds), len(dev_ds))
for i in range(5):
    print (train_ds[i])
print ('\n')
for i in range(5):
    print (test_ds[i])


数据样本一共是702594,999,10000

下面的数据是词汇ID然后以1为开头2为结尾


20210208153346199.png


通过CoupletDataset.get_vocab来获取词汇表

vocab.idx_to_token来表示起始符和结束符


vocab, _ = CoupletDataset.get_vocab()
trg_idx2word = vocab.idx_to_token
vocab_size = len(vocab)
pad_id = vocab[CoupletDataset.EOS_TOKEN]
bos_id = vocab[CoupletDataset.BOS_TOKEN]
eos_id = vocab[CoupletDataset.EOS_TOKEN]
print (pad_id, bos_id, eos_id)


构造dataloder


20210208153928342.png

20210208154410110.png


模型



202102081543532.png

20210208154456255.png


class Seq2SeqEncoder(nn.Layer):
    def __init__(self, vocab_size, embed_dim, hidden_size, num_layers):
        super(Seq2SeqEncoder, self).__init__()
        self.embedder = nn.Embedding(vocab_size, embed_dim)  # 完成查表,得到字词的向量
        self.lstm = nn.LSTM(  # 把数据输入LSTM得到句子的语义表示
            input_size=embed_dim,
            hidden_size=hidden_size,
            num_layers=num_layers,
            dropout=0.2 if num_layers > 1 else 0.)
    def forward(self, sequence, sequence_length):
        inputs = self.embedder(sequence)
        encoder_output, encoder_state = self.lstm(
            inputs, sequence_length=sequence_length)
        # encoder_output [128, 18, 256]  [batch_size,time_steps,hidden_size]
        # encoder_state (tuple) - 最终状态,一个包含h和c的元组。 [2, 128, 256] [2, 128, 256] [num_lauers * num_directions, batch_size, hidden_size]
        return encoder_output, encoder_state


定义AttentionLayer


20210208154755397.png


定义Seq2SeqDecoderCell


20210208160238190.png


总结



20210208160211440.png

课程已经结束人已经懵了,继续学习吧!

目录
相关文章
Paddle 1.8 与 Paddle 2.0 API 映射表
本文档基于 Paddle 1.8 梳理了常用 API 与 Paddle 2.0 对应关系。你可以根据对应关系,快速熟悉 Paddle 2.0 的接口使用。
|
机器学习/深度学习 JSON 缓存
flask部署深度学习api接口
flask部署深度学习api接口
11470 3
|
机器学习/深度学习 数据可视化 API
【paddle深度学习高层API七日打卡营】大作业解析——三岁无良版本
【paddle深度学习高层API七日打卡营】大作业解析——三岁无良版本
162 0
|
机器学习/深度学习 数据可视化 算法
【paddle深度学习高层API七日打卡营】三岁水课第三天——面部关键点识别
【paddle深度学习高层API七日打卡营】三岁水课第三天——面部关键点识别
132 1
【paddle深度学习高层API七日打卡营】三岁水课第三天——面部关键点识别
|
机器学习/深度学习 存储 数据可视化
【paddle深度学习高层API七日打卡营】三岁水课第二天——卷积神经网络和手写数字识别(二)
【paddle深度学习高层API七日打卡营】三岁水课第二天——卷积神经网络和手写数字识别(二)
123 0
【paddle深度学习高层API七日打卡营】三岁水课第二天——卷积神经网络和手写数字识别(二)
|
1天前
|
机器学习/深度学习 自然语言处理 算法
深度学习中的自适应神经网络:理论与应用
【7月更文挑战第1天】本文旨在探究自适应神经网络在深度学习领域的理论基础及其在多个应用场景中的实际效能。通过分析自适应机制如何优化网络结构,提高学习效率和模型泛化能力,我们进一步讨论了自适应神经网络面临的主要挑战及未来发展方向。
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习在自然语言处理中的应用进展
本文旨在深入探讨深度学习技术在自然语言处理领域的应用与进展。通过分析最新的研究数据和案例,本文揭示了深度学习模型如何推动语言理解、生成和翻译的边界。数据显示,与传统方法相比,深度学习模型在多个NLP任务中展现出更高的准确率和效率。本文将详细讨论这些模型的工作原理,它们的优势与挑战,以及未来可能的发展方向。
2 0
|
1天前
|
机器学习/深度学习 安全
深度学习在图像识别中的应用与挑战
随着人工智能技术的飞速发展,深度学习已成为图像识别领域的核心技术之一。本文将深入探讨深度学习在图像识别中的应用场景、技术优势以及面临的主要挑战。通过分析最新的研究数据和案例,本文旨在揭示深度学习如何推动图像识别技术的进步,并讨论其未来发展趋势。
|
1天前
|
机器学习/深度学习 人工智能 监控
探索深度学习在图像识别中的应用
【6月更文挑战第30天】在人工智能的浪潮中,深度学习技术凭借其强大的数据处理和学习能力成为图像识别领域的佼佼者。本文将深入探讨深度学习如何革新图像识别技术,包括卷积神经网络(CNN)的基础原理、关键技术点以及面临的挑战。文章旨在为读者提供深度学习在图像识别应用中的全面视角,并预测未来的发展方向。
|
2天前
|
机器学习/深度学习 数据采集 边缘计算
探索深度学习在自然语言处理中的应用与挑战
【6月更文挑战第29天】 随着人工智能技术的飞速发展,深度学习已经成为推动自然语言处理(NLP)领域革新的核心动力。本文旨在深入探讨深度学习技术在NLP中的广泛应用及其面临的主要挑战。文章首先概述了深度学习在NLP领域的应用现状,包括语音识别、机器翻译、情感分析等方面。随后,详细讨论了在实现高效NLP系统过程中遇到的关键挑战,如数据集的偏见问题、模型的可解释性以及资源消耗等。最后,文章展望了未来深度学习技术在NLP领域的发展趋势和潜在解决方案。