Transformer总结笔记

简介: 1、PyTorch中的基础运算2、自注意力机制3、多头注意力机制4、带隐码的多头注意力机制5、交叉注意力机制

由于阿里云社区的编辑器编辑公式不方便,因此将notion页面直接贴过来了。笔记中有些字母符号的表示未统一,主要是精力有限,表达含义即可。若笔记中存在错误,欢迎指正。
Notion页面链接:https://savory-carol-bd2.notion.site/PyTorch-1f07919d671680bd88a7fd79fe988f1b

目录
相关文章
|
7月前
|
存储 弹性计算 人工智能
阿里云服务器ECS实例规格选型指南:根据使用场景选择合适的配置
随着云计算的快速发展,阿里云提供了丰富多样的云服务器ECS实例规格,满足不同用户需求。然而,面对众多选项,新手往往难以抉择。本文详细解析八大业务场景,包括新手入门、网站业务、数据库、大数据、游戏、视频、AI机器学习及高性能计算等,帮助用户精准选择合适的实例规格。通过了解各实例的硬件配置与软件优化特点,用户可实现资源高效利用与成本合理控制,推动业务发展。更多详情与性能参考可访问阿里云官方文档。
409 17
|
7月前
|
机器学习/深度学习 存储 人工智能
浅入浅出——生成式 AI
团队做 AI 助理,而我之前除了使用一些 AI 类产品,并没有大模型相关的积累。故先补齐一些基本概念,避免和团队同学沟通起来一头雾水。这篇文章是学习李宏毅老师《生成式 AI 导论》的学习笔记。
664 27
浅入浅出——生成式 AI
|
7月前
|
机器学习/深度学习 人工智能 数据库
RAG 2.0 深入解读
本文从RAG 2.0 面临的主要挑战和部分关键技术来展开叙事,还包括了RAG的技术升级和关键技术等。
1331 85
|
8月前
|
人工智能 自然语言处理 供应链
为什么一定要做Agent智能体?
作者通过深入分析、理解、归纳,最后解答了“为什么一定要做Agent”这个问题。
1356 41
为什么一定要做Agent智能体?
|
7月前
|
存储 人工智能 安全
MCP 规范新版本特性全景解析与落地实践
MCP Specification 在 2025-03-26 发布了最新的版本,本文对主要的改动进行详细介绍和解释
1499 145
|
7月前
|
机器学习/深度学习 人工智能 算法
智创 AI 新视界 -- 提升 AI 推理速度的高级方法(16 - 2)
本文深度聚焦提升 AI 推理速度,全面阐述模型压缩(低秩分解、参数量化)、硬件加速(GPU、TPU)及推理算法优化(剪枝感知推理、动态批处理)。结合图像识别等多领域案例与丰富代码示例,以生动形象且专业严谨的方式,为 AI 从业者提供极具价值的技术指南,助力突破 AI 推理速度瓶颈,实现系统性能跃升。
|
7月前
|
人工智能 资源调度 监控
LangChain脚本如何调度及提效?
本文介绍了通过任务调度系统SchedulerX管理LangChain脚本的方法。LangChain是开源的大模型开发框架,支持快速构建AI应用,而SchedulerX可托管AI任务,提供脚本版本管理、定时调度、资源优化等功能。文章重点讲解了脚本管理和调度、Prompt管理、资源利用率提升、限流控制、失败重试、依赖编排及企业级可观测性等内容。同时展望了AI任务调度的未来需求,如模型Failover、Tokens限流等,并提供了相关参考链接。
388 28
LangChain脚本如何调度及提效?
|
7月前
|
人工智能 前端开发 JavaScript
打造一款响应式图片画廊
这段内容介绍了使用 CodeBuddy 辅助开发一个响应式图片画廊页面的过程。项目采用了 CSS Grid 和 Masonry 布局实现不等高图片排列,通过 Lightbox 实现大图预览与键盘切换,并加入了无限滚动加载和分类筛选功能。在开发中,CodeBuddy 提供了从 HTML 结构到交互逻辑的全面支持,帮助解决了布局空白、图片自适应等问题,展现了 AI 助手在前端开发中的高效辅助能力。
217 12
|
7月前
|
机器学习/深度学习 人工智能 算法
PaperCoder:一种利用大型语言模型自动生成机器学习论文代码的框架
PaperCoder是一种基于多智能体LLM框架的工具,可自动将机器学习研究论文转化为代码库。它通过规划、分析和生成三个阶段,系统性地实现从论文到代码的转化,解决当前研究中代码缺失导致的可复现性问题。实验表明,PaperCoder在自动生成高质量代码方面显著优于基线方法,并获得专家高度认可。这一工具降低了验证研究成果的门槛,推动科研透明与高效。
583 19
PaperCoder:一种利用大型语言模型自动生成机器学习论文代码的框架