PyTorch的搜索结果_文章_第17页-阿里云开发者社区

探索云世界动手实践

|

9月前

|

博文

DeepSeek是一个高效、灵活的深度学习框架，旨在简化模型的构建、训练和评估。其核心特点包括模块化设计、自动微分、多后端支持及易于扩展。本文通过手写数字识别的CNN模型实例，展示了DeepSeek的安装、数据准备、模型构建、编译、训练与评估过程，最终模型在测试集上达到了98%以上的准确率。

# 机器学习/深度学习 # 人工智能 # PyTorch # TensorFlow # 算法框架/工具

探索云世界动手实践

|

9月前

|

博文

|

来自：大数据与机器学习

从零开始：如何训练自己的AI模型

### 从零开始：如何训练自己的AI模型训练AI模型如同培养新生儿，需耐心与技巧。首先明确目标（如图像识别、自然语言处理），选择框架（TensorFlow、PyTorch）。接着收集并预处理数据，确保多样性和准确性。然后设计模型结构，如卷积神经网络（CNN），并通过代码实现训练。训练后评估模型性能，调优以避免过拟合。最后部署模型至实际应用。通过猫狗分类器案例，掌握关键步骤和常见问题。训练AI模型是不断迭代优化的过程，实践才能真正掌握精髓。

# 机器学习/深度学习 # 人工智能 # PyTorch # TensorFlow # 算法框架/工具

阿里云大数据Al技术

|

9月前

|

博文

|

来自：大数据与机器学习

云上玩转DeepSeek系列之五：实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核，显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。通过优化后的 FlashMLA，实现了约 16% 的性能提升。

# 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # 缓存 # PyTorch # 异构计算

Deephub

|

9月前

|

博文

|

来自：大数据与机器学习

用PyTorch从零构建 DeepSeek R1：模型架构和分步训练详解

本文详细介绍了DeepSeek R1模型的构建过程，涵盖从基础模型选型到多阶段训练流程，再到关键技术如强化学习、拒绝采样和知识蒸馏的应用。

# 机器学习/深度学习 # 算法 # 安全 # PyTorch # 算法框架/工具

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

TPO：告别微调！这个AI框架让大模型实时进化：无需训练直接优化，输入问题越用越聪明，输出质量暴涨50%

TPO（Test-Time Prompt Optimization）框架，通过奖励模型和迭代反馈优化大语言模型输出，无需训练即可显著提升性能，支持动态对齐人类偏好，降低优化成本。

# 自然语言处理 # 人工智能 # JSON # PyTorch # 数据格式 # 异构计算

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

BioMedGPT-R1：生物医药ChatGPT诞生！蒸馏DeepSeek R1突破人类专家水平，分子解析+靶点预测一键搞定

BioMedGPT-R1 是清华大学与水木分子联合开发的多模态生物医药大模型，支持跨模态问答、药物分子理解与靶点挖掘，性能显著提升。

# 云解析DNS # 自然语言处理 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具

蓝易云

|

9月前

|

博文

用PyTorch从零开始编写DeepSeek-V2

本文详细介绍了如何使用PyTorch从零开始实现DeepSeek-V2，包括数据准备、模型构建、训练和测试等各个环节。掌握这些内容后，您可以根据自己的需求对模型进行扩展和优化，应用于更广泛的图像分析任务中。希望本指南能帮助您在深度学习领域更进一步。

# 机器学习/深度学习 # 数据采集 # PyTorch # 测试技术 # 算法框架/工具

Deephub

|

9月前

|

博文

|

来自：大数据与机器学习

Vision Transformer中的图像块嵌入详解：线性投影和二维卷积的数学原理与代码实现

本文详细介绍了 Vision Transformer 中图像块嵌入的实现过程，结合理论与代码示例，帮助读者深入理解这一关键机制。

# 机器学习/深度学习 # 存储 # 数据可视化 # PyTorch # 算法框架/工具

平凡程序猿~

|

9月前

|

博文

从零开始深度学习：全连接层、损失函数与梯度下降的详尽指南

在深度学习的领域，全连接层、损失函数与梯度下降是三块重要的基石。如果你正在踏上深度学习的旅程，理解它们是迈向成功的第一步。这篇文章将从概念到代码、从基础到进阶，详细剖析这三个主题，帮助你从小白成长为能够解决实际问题的开发者。

# 微服务引擎 # 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # 开发者

平凡程序猿~

|

9月前

|

博文

深度学习工具和框架详细指南：PyTorch、TensorFlow、Keras

在深度学习的世界中，PyTorch、TensorFlow和Keras是最受欢迎的工具和框架，它们为研究者和开发者提供了强大且易于使用的接口。在本文中，我们将深入探索这三个框架，涵盖如何用它们实现经典深度学习模型，并通过代码实例详细讲解这些工具的使用方法。

# GPU云服务器 # 机器学习/深度学习 # PyTorch # TensorFlow # API # 算法框架/工具

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch