我是小白同学_高分内容_个人页-阿里云开发者社区

发表了文章 2025-02-24

Transformer 学习小结（输出输入）

在模型处理中，输入文本需经预处理，包括分词、词汇表构建及填充（padding），并使用填充掩码避免无效计算。位置嵌入为Transformer提供顺序信息，编码器通过自注意力机制和前馈网络处理输入序列。输出处理中，解码器根据编码器输出生成目标序列，使用序列掩码防止信息泄露，逐步生成单词，并在测试阶段采用贪婪或束搜索优化输出。
发表了文章 2025-02-20

Transformer 学习笔记 | Decoder

本文记录了笔者学习Transformer的过程，重点介绍了填充（padding）和掩码（masking）机制。掩码确保解码器只依赖于之前的位置，避免信息泄露，保持因果关系及训练与推理的一致性。通过线性层和softmax函数生成输出概率，并使用梯度下降和反向传播进行训练。评估指标包括BLEU、ROUGE、METEOR和困惑度等。欢迎指正。
发表了文章 2025-02-18

Transformer 学习笔记 | Encoder

本文记录了学习Transformer模型过程中对Encoder部分的理解，包括多头自注意力机制（Multi-Head Self-Attention）和前馈网络（Feed-Forward Network）的工作原理。每个Encoder Layer包含残差连接（Residual Connection）和层归一化（Layer Normalization），以缓解梯度消失问题并稳定训练过程。文中详细解释了Q、K、V的含义及缩放点积注意力机制（Scaled Dot-Product Attention），并通过图解展示了各组件的工作流程。欢迎指正。
发表了文章 2025-02-11

Transformer 学习笔记 | Seq2Seq，Encoder-Decoder，分词器tokenizer，attention，词嵌入

本文记录了学习Transformer过程中的笔记，介绍了Seq2Seq模型及其编码器-解码器结构。Seq2Seq模型通过将输入序列转化为上下文向量，再由解码器生成输出序列，适用于机器翻译、对话系统等任务。文章详细探讨了Seq2Seq的优势与局限，如信息压缩导致的细节丢失和短期记忆限制，并引入注意力机制来解决长序列处理问题。此外，还介绍了分词器（tokenizer）的工作原理及不同类型分词器的特点，以及词嵌入和Transformer架构的基础知识。文中包含大量图表和实例，帮助理解复杂的概念。参考资料来自多个权威来源，确保内容的准确性和全面性。
提交了问题 2023-07-13

安装部署Stable Diffusion的时候遇到困难

暂无更多信息

发表了文章 2025-02-25

Transformer 学习小结（输出输入）
发表了文章 2025-02-20

Transformer 学习笔记 | Decoder
发表了文章 2025-02-18

Transformer 学习笔记 | Encoder
发表了文章 2025-02-11

Transformer 学习笔记 | Seq2Seq，Encoder-Decoder，分词器tokenizer，attention，词嵌入

正在加载, 请稍后...

滑动查看更多

回答了问题 2025-03-04

什么样的代码让人一眼就能看出是AI写的？

变量命名规范，注释详尽，格式清晰的代码。简单点来说，就是比我写得好的代码（doge

赞75 踩0 评论0
回答了问题 2025-02-20

春节假期返工后，你有哪些提升职场幸福感的小技巧？

倒数下一次的假期！

赞13 踩0 评论0
回答了问题 2023-07-29

有什么暗号可以证明你是程序员？

宁添一条功能,不修一个bug！

赞4 踩0 评论0
提交了问题 2023-07-13

安装部署Stable Diffusion的时候遇到困难

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

我是小白同学_个人页

个人介绍

擅长的技术

Transformer 学习小结（输出输入）

Transformer 学习笔记 | Decoder

Transformer 学习笔记 | Encoder

Transformer 学习笔记 | Seq2Seq，Encoder-Decoder，分词器tokenizer，attention，词嵌入

安装部署Stable Diffusion的时候遇到困难

Transformer 学习小结（输出输入）

Transformer 学习笔记 | Decoder

Transformer 学习笔记 | Encoder

Transformer 学习笔记 | Seq2Seq，Encoder-Decoder，分词器tokenizer，attention，词嵌入

什么样的代码让人一眼就能看出是AI写的？

春节假期返工后，你有哪些提升职场幸福感的小技巧？

有什么暗号可以证明你是程序员？

安装部署Stable Diffusion的时候遇到困难

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

我是小白同学_个人页

个人介绍

擅长的技术

Transformer 学习小结（输出输入）

Transformer 学习笔记 | Decoder

Transformer 学习笔记 | Encoder

Transformer 学习笔记 | Seq2Seq，Encoder-Decoder，分词器tokenizer，attention，词嵌入

安装部署Stable Diffusion的时候遇到困难

Transformer 学习小结（输出输入）

Transformer 学习笔记 | Decoder

Transformer 学习笔记 | Encoder

Transformer 学习笔记 | Seq2Seq，Encoder-Decoder，分词器tokenizer，attention，词嵌入

什么样的代码让人一眼就能看出是AI写的？

春节假期返工后，你有哪些提升职场幸福感的小技巧？

有什么暗号可以证明你是程序员？

安装部署Stable Diffusion的时候遇到困难