PyTorch的搜索结果_热门_第11页-阿里云开发者社区

智能计算老群群

|

博文

Transformer模型近年来成为自然语言处理（NLP）领域的焦点，其强大的特征提取能力和并行计算优势在众多任务中取得显著效果。本文详细解读Transformer的原理，包括自注意力机制和编码器-解码器结构，并提供基于PyTorch的代码演示，展示了其在文本分类等任务中的应用。

# 机器翻译 # 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 并行计算 # PyTorch # 算法框架/工具

TsingtaoAI

|

11月前

|

博文

企业内训｜基于华为昇腾910B算力卡的大模型部署和调优-上海某央企智算中心

近日上海，TsingtaoAI为某央企智算中心交付华为昇腾910B算力卡的大模型部署和调优课程。课程深入讲解如何在昇腾NPU上高效地训练、调优和部署PyTorch与Transformer模型，并结合实际应用场景，探索如何优化和迁移模型至昇腾NPU平台。课程涵盖从模型预训练、微调、推理与评估，到性能对比、算子适配、模型调优等一系列关键技术，帮助学员深入理解昇腾NPU的优势及其与主流深度学习框架（如PyTorch、Deepspeed、MindSpore）的结合应用。

# GPU云服务器 # 性能测试 # 机器学习/深度学习 # 机器人 # PyTorch # 算法框架/工具 # AI芯片

clichong

|

博文

YOLOv5的Tricks | 【Trick11】在线模型训练可视化工具wandb(Weights & Biases)

# 日志服务 # 机器学习/深度学习 # 数据可视化 # PyTorch # 测试技术 # TensorFlow # API # 算法框架/工具 # Python

5i77ajz5u7ji6

|

博文

CVPR2021-即插即用 | Coordinate Attention详解与CA Block实现(文末获取论文原文)（一）

# 机器学习/深度学习 # 编解码 # PyTorch # 算法框架/工具 # 计算机视觉

zzy的aly

|

博文

Pytorch学习笔记(二):nn.Conv2d()函数详解

这篇文章是关于PyTorch中nn.Conv2d函数的详解，包括其函数语法、参数解释、具体代码示例以及与其他维度卷积函数的区别。

# 机器学习/深度学习 # PyTorch # TensorFlow # 算法框架/工具

Deephub

|

8月前

|

博文

|

来自：大数据与机器学习

PyTorch CUDA内存管理优化：深度理解GPU资源分配与缓存机制

本文深入探讨了PyTorch中GPU内存管理的核心机制，特别是CUDA缓存分配器的作用与优化策略。文章分析了常见的“CUDA out of memory”问题及其成因，并通过实际案例（如Llama 1B模型训练）展示了内存分配模式。PyTorch的缓存分配器通过内存池化、延迟释放和碎片化优化等技术，显著提升了内存使用效率，减少了系统调用开销。此外，文章还介绍了高级优化方法，包括混合精度训练、梯度检查点技术及自定义内存分配器配置。这些策略有助于开发者在有限硬件资源下实现更高性能的深度学习模型训练与推理。

# GPU云服务器 # 缓存 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

游客2s2fjn5luntxa

|

8天前

|

问答

|

来自：通义大模型

RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

# 大模型服务平台百炼 # 算法框架/工具 # PyTorch

半颗糖也甜入人心

|

博文

|

来自： ModelScope模型即服务

Dropout的深入理解（基础介绍、模型描述、原理深入、代码实现以及变种）

# 机器学习/深度学习 # PyTorch # 算法框架/工具 # Python

Deephub

|

博文

|

来自：大数据与机器学习

归一化技术比较研究：Batch Norm, Layer Norm, Group Norm

本文将使用合成数据集对三种归一化技术进行比较，并在每种配置下分别训练模型。记录训练损失，并比较模型的性能。

# 机器学习/深度学习 # PyTorch # 算法框架/工具

Deephub

|

博文

|

来自：大数据与机器学习

为什么大型语言模型都在使用 SwiGLU 作为激活函数？

SwiGLU可以说是在大语言模型中最常用到的激活函数，我们本篇文章就来对他进行详细的介绍。

# 机器学习/深度学习 # PyTorch # 算法框架/工具

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch