PyTorch的搜索结果_热门_第10页-阿里云开发者社区

智能计算老群群

|

博文

Transformer模型近年来成为自然语言处理（NLP）领域的焦点，其强大的特征提取能力和并行计算优势在众多任务中取得显著效果。本文详细解读Transformer的原理，包括自注意力机制和编码器-解码器结构，并提供基于PyTorch的代码演示，展示了其在文本分类等任务中的应用。

# 机器翻译 # 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 并行计算 # PyTorch # 算法框架/工具

TechLead

|

博文

长短时记忆网络（LSTM）完整实战：从理论到PyTorch实战演示

# 自然语言处理 # 机器学习/深度学习 # 资源调度 # 自然语言处理 # PyTorch # 算法框架/工具

不要葱姜蒜

|

11月前

|

博文

|

来自：通义大模型

Qwen2.5-7B-Instruct Lora 微调

本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。

# 大模型服务平台百炼 # 搜索推荐 # 物联网 # PyTorch # 算法框架/工具 # Python

探索云世界动手实践

|

9月前

|

博文

|

来自：大数据与机器学习

从零开始：如何训练自己的AI模型

### 从零开始：如何训练自己的AI模型训练AI模型如同培养新生儿，需耐心与技巧。首先明确目标（如图像识别、自然语言处理），选择框架（TensorFlow、PyTorch）。接着收集并预处理数据，确保多样性和准确性。然后设计模型结构，如卷积神经网络（CNN），并通过代码实现训练。训练后评估模型性能，调优以避免过拟合。最后部署模型至实际应用。通过猫狗分类器案例，掌握关键步骤和常见问题。训练AI模型是不断迭代优化的过程，实践才能真正掌握精髓。

# 机器学习/深度学习 # 人工智能 # PyTorch # TensorFlow # 算法框架/工具

程序员行者孙

|

博文

【已解决】RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronous

# 机器学习/深度学习 # 并行计算 # PyTorch # API # 算法框架/工具

TsingtaoAI

|

10月前

|

博文

内部干货 | 基于华为昇腾910B算力卡的大模型部署和调优-课程讲义

近日上海，TsingtaoAI为某央企智算中心交付华为昇腾910B算力卡的大模型部署和调优课程。课程深入讲解如何在昇腾NPU上高效地训练、调优和部署PyTorch与Transformer模型，并结合实际应用场景，探索如何优化和迁移模型至昇腾NPU平台。课程涵盖从模型预训练、微调、推理与评估，到性能对比、算子适配、模型调优等一系列关键技术，帮助学员深入理解昇腾NPU的优势及其与主流深度学习框架（如PyTorch、Deepspeed、MindSpore）的结合应用。

# GPU云服务器 # 资源管理 # 自然语言处理 # 性能测试 # 负载均衡 # 日志服务 # 机器学习/深度学习 # PyTorch # 调度 # 算法框架/工具 # AI芯片

雷锋网

|

博文

深度强化学习从入门到大师：简单介绍A3C （第五部分）

本文为 AI 研习社编译的技术博客，原标题：An intro to Advantage Actor Critic methods: let’s play So

# 机器学习/深度学习 # 人工智能 # 算法 # PyTorch # Serverless # 算法框架/工具 # C++ # 计算机视觉 # 异构计算

是Yu欸

|

博文

大概率（5重方法）解决RuntimeError: CUDA out of memory. Tried to allocate ... MiB

# GPU云服务器 # 并行计算 # PyTorch # Linux # 算法框架/工具 # 异构计算

周周的奇妙编程

|

12月前

|

博文

全网首发！真·从0到1！万字长文带你入门Qwen2.5-Coder——介绍、体验、本地部署及简单微调

2024年11月12日，阿里云通义大模型团队正式开源通义千问代码模型全系列，包括6款Qwen2.5-Coder模型，每个规模包含Base和Instruct两个版本。其中32B尺寸的旗舰代码模型在多项基准评测中取得开源最佳成绩，成为全球最强开源代码模型，多项关键能力超越GPT-4o。Qwen2.5-Coder具备强大、多样和实用等优点，通过持续训练，结合源代码、文本代码混合数据及合成数据，显著提升了代码生成、推理和修复等核心任务的性能。此外，该模型还支持多种编程语言，并在人类偏好对齐方面表现出色。本文为周周的奇妙编程原创，阿里云社区首发，未经同意不得转载。

# 并行计算 # 前端开发 # 物联网 # PyTorch # 算法框架/工具

LeapMay

|

博文

CUDA和显卡驱动以及pytorch版本的对应关系

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # PyTorch # 编译器 # 算法框架/工具 # 开发工具 # 图形学 # 数据中心 # C++ # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch