PyTorch的搜索结果_第3页-阿里云开发者社区

Deephub

|

1月前

|

博文

手写 Triton Softmax Kernel：程序实例、块大小、mask 与指针算术

本文以Softmax为切入点，用通俗图解与手写Triton内核，揭开GPU编程黑箱：从块并行模型、片上计算融合，到内存带宽瓶颈与性能悬崖现象，带你真正理解AI算子在GPU上如何高效运行。

# 人工智能 # PyTorch # 算法框架/工具 # 异构计算 # Python

霂榆

|

1月前

|

博文

在 AMD ROCm DSW 上部署 Qwen3.6-27B-FP8：vLLM、MTP 解码加速与小并发压测

本文记录一次在 ModelScope DSW AMD GPU 实例上完成的 Qwen3.6-27B-FP8 推理实践。实验重点不是单纯证明模型可以启动，而是围绕 vLLM ROCm 服务、Qwen MTP 投机解码、near-8K 长上下文正确性验证、FP8 KV cache 和小并发 serving 压测，整理一套可复现、可复查、可继续扩展的 AMD GPU 大模型推理 baseline。

# 算法 # 测试技术 # PyTorch # 调度 # 异构计算

卿云阁

|

1月前

|

博文

|

来自：大数据与机器学习

PyTorch深度学习实战 |SegNet

CamVid_11是面向自动驾驶的语义分割数据集，含700+张精准标注图像，划分为训练/验证/测试集。涵盖道路、车辆、行人等11类场景目标（含背景共12类），支持SegNet等模型训练与评估。

# 机器学习/深度学习 # 自动驾驶 # PyTorch # 算法框架/工具 # 计算机视觉

卿云阁

|

1月前

|

博文

|

来自：大数据与机器学习

PyTorch深度学习实战 |手算变分自编码器（VAE）

本文详解变分自编码器（VAE）原理：指出传统自编码器因潜在空间无序而无法生成新图像；VAE通过引入概率建模，用高斯分布近似后验，并结合重构损失与KL散度优化，使潜在空间连续可采样，从而实现可控图像生成。含公式推导、重参数化技巧及完整代码实现。（239字）

# 机器学习/深度学习 # 数据可视化 # PyTorch # Serverless # 算法框架/工具

卿云阁

|

1月前

|

博文

|

来自：大数据与机器学习

PyTorch深度学习实战 | Transformer模型初识

本文介绍了Transformer模型在机器翻译任务中的工作原理。主要内容包括：1）模型分为编码器（处理英文输入）和解码器（生成中文输出）两部分；2）推理时采用自回归模式，逐步生成翻译结果；3）训练时使用教师强制模式，始终以真实标签指导模型学习。文章详细阐述了编码器-解码器结构的工作流程，包括词嵌入、多头注意力机制等核心组件，以及如何通过残差连接和层标准化优化模型性能。最后解释了编码器和解码器三个关键计算步骤的张量维度变化过程。

# 机器学习/深度学习 # 自然语言处理 # 算法 # PyTorch # 算法框架/工具

卿云阁

|

1月前

|

博文

|

来自：大数据与机器学习

图解入门Pytorch

什么是PyTorch？PyTorch 就像是深度学习的“工具箱”：就像你做饭需要锅、铲子、刀和菜一样，做深度学习就需要工具。而 PyTorch 就是那个专门为做深度学习准备的“工具箱”。它提供了很多现成的工具和操作，让你做人工智能的研究或开发变得更简单、快捷。优点：能跑在 GPU 上，速度超级快：训练深度学习模型很耗计算力，PyTorch 能自动使用你的显卡（GPU）来加速计算。如果你有 GPU，PyTorch 可以帮你大大提高训练速度，不需要你去做特别复杂的设置。自动求导帮你“自己学”

# 机器学习/深度学习 # PyTorch # 算法框架/工具 # 异构计算 # Python

卿云阁

|

1月前

|

博文

|

来自：大数据与机器学习

PyTorch深度学习实战 | 手算生成对抗网络GAN

GAN（生成对抗网络）是一种深度学习模型，由生成器与判别器构成对抗训练框架：生成器学习伪造逼真数据，判别器则努力区分真假。二者博弈迭代，最终生成器可产出以假乱真的高质量样本，广泛应用于图像生成、数据增强等领域。

# 机器学习/深度学习 # PyTorch # 算法框架/工具

卿云阁

|

1月前

|

博文

|

来自：大数据与机器学习

手算神经网络

本文介绍了使用2×3×1神经网络实现房价预测的全过程。首先通过手动计算演示了单个样本的前向传播和反向传播，包括权重初始化和梯度更新。随后使用PyTorch实现了完整的神经网络模型，包含数据准备、网络结构定义、损失函数计算和优化器设置。在训练过程中记录了损失值变化，并可视化展示训练效果。最后提供了一个挖空版本的代码框架，帮助读者逐步完成神经网络的关键实现步骤，包括导入包、定义网络框架、数据准备、训练循环和结果可视化等模块。通过这个完整的项目实践，读者可以掌握神经网络从理论到实现的全流程。

# 机器学习/深度学习 # 人工智能 # 数据可视化 # PyTorch # 算法框架/工具

卿云阁

|

1月前

|

博文

|

来自：大数据与机器学习

PyTorch深度学习实战 |语义分割基础知识

《PyTorch语义分割实战解析》摘要：本文深入探讨语义分割中的标签处理技术，对比P模式与L模式的本质区别。P模式通过调色板实现人机双重视觉效果，底层存储类别索引（0,1,2等），表面呈现彩色可视化效果。针对边缘模糊问题，提出使用255作为忽略标签（IgnoreLabel）的解决方案。文章系统梳理7大评价指标：从基础的像素准确率(PA)到综合性的mIoU和mF1，特别强调mIoU作为核心指标的重要性，其平衡各类别的特性使其成为模型性能评估的黄金标准。通过技术原理与实战经验的结合，为深度学习从业者提供了语义分

# 机器学习/深度学习 # 数据可视化 # PyTorch # 算法框架/工具 # 索引

卿云阁

|

1月前

|

博文

|

来自：大数据与机器学习

PyTorch深度学习实战 |手动计算 Transformer和完整的代码实现

本文介绍了基于PyTorch实现Transformer模型的完整过程。主要内容包括：1）Transformer架构的核心组件实现，如多头注意力机制、位置前馈网络、位置编码等；2）模型构建步骤，包括词嵌入层、编码器/解码器块和输出层的实现；3）完整的训练流程，包含数据处理、损失计算和参数优化；4）评估方法验证模型性能。文章通过代码示例详细展示了如何从零开始构建Transformer，并应用于机器翻译任务，同时对模型各层的输入输出维度进行了说明。该实现可作为深度学习实践者学习Transformer架构的实用指南

# 机器学习/深度学习 # 自然语言处理 # PyTorch # 算法框架/工具 # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch