PyTorch的搜索结果_文章_第12页-阿里云开发者社区

pai_rec_coder

|

7月前

|

博文

|

TorchEasyRec处理器支持Intel和AMD的CPU服务器及GPU推理，兼容普通PyTorch模型。它具备TorchEasyRec的特征工程（FG）和模型推理功能，提供更快的推理性能，降低成本。通过Item Feature Cache特性，它能够缓存特征以减少网络传输，进一步提升特征工程与推理的速度。

# 机器学习/深度学习 # 缓存 # PyTorch # 算法框架/工具 # 异构计算

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

DeepSeek开源周第四弹之一！DualPipe：训练V3/R1的双向流水线并行技术，计算与训练完全重叠，训练效率提升200%

DeepSeek 开源的 DualPipe 技术通过双向流水线并行设计，显著提升大规模深度学习模型的训练效率，优化计算与通信重叠，降低内存峰值需求，适用于推理加速、多模态数据处理等场景。

# 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # PyTorch # 数据处理 # 调度

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

DeepSeek开源周第四弹之二！EPLB：专为V3/R1设计的专家并行负载均衡器，让GPU利用率翻倍！

EPLB 是 DeepSeek 推出的专家并行负载均衡器，通过冗余专家策略和负载均衡算法，优化大规模模型训练中的 GPU 资源利用率和训练效率。

# GPU云服务器 # 人工智能平台 PAI # 负载均衡 # 人工智能 # 负载均衡 # 算法 # PyTorch # 异构计算

探索云世界动手实践

|

7月前

|

博文

从词袋到Transformer：自然语言处理的演进与实战

自然语言处理（NLP）是人工智能的重要分支，从早期的规则系统发展到如今的深度学习模型，经历了词袋模型、词嵌入、RNN/LSTM/GRU，再到革命性的Transformer架构。本文通过代码和案例详细介绍了这些技术的演进，并展示了如何从简单的词袋模型过渡到强大的Transformer，涵盖文本分类等实战应用，帮助读者深入理解NLP的核心技术和未来发展潜力。

# 自然语言处理 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具

探索云世界动手实践

|

7月前

|

博文

DeepSeek进阶开发与应用1：DeepSeek框架概述与基础应用

DeepSeek是一个高效、灵活的深度学习框架，旨在简化模型的构建、训练和评估。其核心特点包括模块化设计、自动微分、多后端支持及易于扩展。本文通过手写数字识别的CNN模型实例，展示了DeepSeek的安装、数据准备、模型构建、编译、训练与评估过程，最终模型在测试集上达到了98%以上的准确率。

# 机器学习/深度学习 # 人工智能 # PyTorch # TensorFlow # 算法框架/工具

探索云世界动手实践

|

7月前

|

博文

|

来自：大数据与机器学习

从零开始：如何训练自己的AI模型

### 从零开始：如何训练自己的AI模型训练AI模型如同培养新生儿，需耐心与技巧。首先明确目标（如图像识别、自然语言处理），选择框架（TensorFlow、PyTorch）。接着收集并预处理数据，确保多样性和准确性。然后设计模型结构，如卷积神经网络（CNN），并通过代码实现训练。训练后评估模型性能，调优以避免过拟合。最后部署模型至实际应用。通过猫狗分类器案例，掌握关键步骤和常见问题。训练AI模型是不断迭代优化的过程，实践才能真正掌握精髓。

# 机器学习/深度学习 # 人工智能 # PyTorch # TensorFlow # 算法框架/工具

阿里云大数据Al技术

|

7月前

|

博文

|

来自：大数据与机器学习

云上玩转DeepSeek系列之五：实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核，显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。通过优化后的 FlashMLA，实现了约 16% 的性能提升。

# 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # 缓存 # PyTorch # 异构计算

Deephub

|

7月前

|

博文

|

来自：大数据与机器学习

用PyTorch从零构建 DeepSeek R1：模型架构和分步训练详解

本文详细介绍了DeepSeek R1模型的构建过程，涵盖从基础模型选型到多阶段训练流程，再到关键技术如强化学习、拒绝采样和知识蒸馏的应用。

# 机器学习/深度学习 # 算法 # 安全 # PyTorch # 算法框架/工具

蚝油菜花