开发者社区人工智能文章正文

Transformer总结笔记

2025-05-11 156

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 1、PyTorch中的基础运算2、自注意力机制3、多头注意力机制4、带隐码的多头注意力机制5、交叉注意力机制

由于阿里云社区的编辑器编辑公式不方便，因此将notion页面直接贴过来了。笔记中有些字母符号的表示未统一，主要是精力有限，表达含义即可。若笔记中存在错误，欢迎指正。
Notion页面链接：https://savory-carol-bd2.notion.site/PyTorch-1f07919d671680bd88a7fd79fe988f1b

文章标签：

机器学习/深度学习

算法框架/工具

PyTorch

XiaoPenYou

是牛老师啊

7月前

存储弹性计算人工智能

阿里云服务器ECS实例规格选型指南：根据使用场景选择合适的配置

随着云计算的快速发展，阿里云提供了丰富多样的云服务器ECS实例规格，满足不同用户需求。然而，面对众多选项，新手往往难以抉择。本文详细解析八大业务场景，包括新手入门、网站业务、数据库、大数据、游戏、视频、AI机器学习及高性能计算等，帮助用户精准选择合适的实例规格。通过了解各实例的硬件配置与软件优化特点，用户可实现资源高效利用与成本合理控制，推动业务发展。更多详情与性能参考可访问阿里云官方文档。

是牛老师啊

409 17 17

阿里云开发者

7月前

机器学习/深度学习存储人工智能

浅入浅出——生成式 AI

团队做 AI 助理，而我之前除了使用一些 AI 类产品，并没有大模型相关的积累。故先补齐一些基本概念，避免和团队同学沟通起来一头雾水。这篇文章是学习李宏毅老师《生成式 AI 导论》的学习笔记。

阿里云开发者

664 27 32

阿里云开发者

7月前

机器学习/深度学习人工智能数据库

RAG 2.0 深入解读

本文从RAG 2.0 面临的主要挑战和部分关键技术来展开叙事，还包括了RAG的技术升级和关键技术等。

阿里云开发者

1331 85 90

阿里云开发者

8月前

人工智能自然语言处理供应链

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1356 41 42

阿里云云原生

7月前

存储人工智能安全

MCP 规范新版本特性全景解析与落地实践

MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释

阿里云云原生

1499 145 154

青云交（Java大数据AI云原生Python）

7月前

机器学习/深度学习人工智能算法

智创 AI 新视界 -- 提升 AI 推理速度的高级方法（16 - 2）

本文深度聚焦提升 AI 推理速度，全面阐述模型压缩（低秩分解、参数量化）、硬件加速（GPU、TPU）及推理算法优化（剪枝感知推理、动态批处理）。结合图像识别等多领域案例与丰富代码示例，以生动形象且专业严谨的方式，为 AI 从业者提供极具价值的技术指南，助力突破 AI 推理速度瓶颈，实现系统性能跃升。

青云交（Java大数据AI云原生Python）

614 73 75

阿里云开发者

7月前

人工智能资源调度监控

LangChain脚本如何调度及提效？

本文介绍了通过任务调度系统SchedulerX管理LangChain脚本的方法。LangChain是开源的大模型开发框架，支持快速构建AI应用，而SchedulerX可托管AI任务，提供脚本版本管理、定时调度、资源优化等功能。文章重点讲解了脚本管理和调度、Prompt管理、资源利用率提升、限流控制、失败重试、依赖编排及企业级可观测性等内容。同时展望了AI任务调度的未来需求，如模型Failover、Tokens限流等，并提供了相关参考链接。

阿里云开发者

388 28 30

繁依Fanyi

7月前

人工智能前端开发 JavaScript

打造一款响应式图片画廊

这段内容介绍了使用 CodeBuddy 辅助开发一个响应式图片画廊页面的过程。项目采用了 CSS Grid 和 Masonry 布局实现不等高图片排列，通过 Lightbox 实现大图预览与键盘切换，并加入了无限滚动加载和分类筛选功能。在开发中，CodeBuddy 提供了从 HTML 结构到交互逻辑的全面支持，帮助解决了布局空白、图片自适应等问题，展现了 AI 助手在前端开发中的高效辅助能力。

繁依Fanyi

217 12 17

Deephub

7月前

机器学习/深度学习人工智能算法

PaperCoder：一种利用大型语言模型自动生成机器学习论文代码的框架

PaperCoder是一种基于多智能体LLM框架的工具，可自动将机器学习研究论文转化为代码库。它通过规划、分析和生成三个阶段，系统性地实现从论文到代码的转化，解决当前研究中代码缺失导致的可复现性问题。实验表明，PaperCoder在自动生成高质量代码方面显著优于基线方法，并获得专家高度认可。这一工具降低了验证研究成果的门槛，推动科研透明与高效。

Deephub

583 19 19

Transformer总结笔记

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Transformer总结笔记

热门文章

最新文章

相关电子书