PyTorch的搜索结果_第16页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

NotaGen：中央音乐学院联合清华推出AI音乐生成模型，古典乐谱一键生成，音乐性接近人类！

NotaGen 是由中央音乐学院、北京航空航天大学、清华大学等机构联合推出的音乐生成模型，基于模仿大型语言模型的训练范式，能够生成高质量的古典乐谱。该模型通过预训练、微调和强化学习相结合的方式，显著提升了符号音乐生成的艺术性和可控性。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 并行计算 # 算法 # PyTorch

Deephub

|

8月前

|

博文

|

来自：大数据与机器学习

深入解析图神经网络注意力机制：数学原理与可视化实现

本文深入解析了图神经网络（GNNs）中自注意力机制的内部运作原理，通过可视化和数学推导揭示其工作机制。文章采用“位置-转移图”概念框架，并使用NumPy实现代码示例，逐步拆解自注意力层的计算过程。文中详细展示了从节点特征矩阵、邻接矩阵到生成注意力权重的具体步骤，并通过四个类（GAL1至GAL4）模拟了整个计算流程。最终，结合实际PyTorch Geometric库中的代码，对比分析了核心逻辑，为理解GNN自注意力机制提供了清晰的学习路径。

# 云解析DNS # 机器学习/深度学习 # 数据可视化 # PyTorch # 索引 # Python

胖胖雕

|

8月前

|

博文

Windows下CUDA+pytorch安装

以下是关于在Windows下安装CUDA和PyTorch的简要介绍及参考链接：

# 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

AIMv2：苹果开源多模态视觉模型，自回归预训练革新图像理解

AIMv2 是苹果公司开源的多模态自回归预训练视觉模型，通过图像和文本的深度融合提升视觉模型的性能，适用于多种视觉和多模态任务。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 编解码 # PyTorch # 算法框架/工具

Deephub

|

8月前

|

博文

|

来自：大数据与机器学习

PyTorch内存优化的10种策略总结：在有限资源环境下高效训练模型

在大规模深度学习模型训练中，GPU内存容量常成为瓶颈，特别是在训练大型语言模型和视觉Transformer时。本文系统介绍了多种内存优化策略，包括混合精度训练、低精度训练（如BF16）、梯度检查点、梯度累积、张量分片与分布式训练、

# 机器学习/深度学习 # 存储 # PyTorch # 算法框架/工具 # 异构计算

pai_rec_coder

|

9月前

|

博文

|

来自：大数据与机器学习

为什么要用TorchEasyRec processor？

TorchEasyRec处理器支持Intel和AMD的CPU服务器及GPU推理，兼容普通PyTorch模型。它具备TorchEasyRec的特征工程（FG）和模型推理功能，提供更快的推理性能，降低成本。通过Item Feature Cache特性，它能够缓存特征以减少网络传输，进一步提升特征工程与推理的速度。

# 机器学习/深度学习 # 缓存 # PyTorch # 算法框架/工具 # 异构计算

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

DeepSeek开源周第四弹之一！DualPipe：训练V3/R1的双向流水线并行技术，计算与训练完全重叠，训练效率提升200%

DeepSeek 开源的 DualPipe 技术通过双向流水线并行设计，显著提升大规模深度学习模型的训练效率，优化计算与通信重叠，降低内存峰值需求，适用于推理加速、多模态数据处理等场景。

# 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # PyTorch # 数据处理 # 调度

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

DeepSeek开源周第四弹之二！EPLB：专为V3/R1设计的专家并行负载均衡器，让GPU利用率翻倍！

EPLB 是 DeepSeek 推出的专家并行负载均衡器，通过冗余专家策略和负载均衡算法，优化大规模模型训练中的 GPU 资源利用率和训练效率。

# GPU云服务器 # 人工智能平台 PAI # 负载均衡 # 人工智能 # 负载均衡 # 算法 # PyTorch # 异构计算

探索云世界动手实践

|

9月前

|

博文

从词袋到Transformer：自然语言处理的演进与实战

自然语言处理（NLP）是人工智能的重要分支，从早期的规则系统发展到如今的深度学习模型，经历了词袋模型、词嵌入、RNN/LSTM/GRU，再到革命性的Transformer架构。本文通过代码和案例详细介绍了这些技术的演进，并展示了如何从简单的词袋模型过渡到强大的Transformer，涵盖文本分类等实战应用，帮助读者深入理解NLP的核心技术和未来发展潜力。

# 自然语言处理 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具

探索云世界动手实践

|

9月前

|

博文

DeepSeek进阶开发与应用1：DeepSeek框架概述与基础应用

DeepSeek是一个高效、灵活的深度学习框架，旨在简化模型的构建、训练和评估。其核心特点包括模块化设计、自动微分、多后端支持及易于扩展。本文通过手写数字识别的CNN模型实例，展示了DeepSeek的安装、数据准备、模型构建、编译、训练与评估过程，最终模型在测试集上达到了98%以上的准确率。

# 机器学习/深度学习 # 人工智能 # PyTorch # TensorFlow # 算法框架/工具

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch