PyTorch的搜索结果_文章_第10页-阿里云开发者社区

lorelai

|

5月前

|

博文

|

【pytorch】【202504】关于torch.nn.Linear

小白从开始这段代码展示了`nn.Linear`的使用及其背后的原理。此外，小白还深入研究了PyTorch的核心类`torch.nn.Module`以及其子类`torch.nn.Linear`的源码。`grad_fn`作为张量的一个属性，用于指导反向传播进一步地，小白探讨了`requires_grad`与叶子节点（leaf tensor）的关系。叶子节点是指在计算图中没有前驱操作的张量，只有设置了`requires_grad=True`的叶子节点才会在反向传播时保存梯度。最后，小白学习了PyTorch中的三种梯度模式通过以上学习小白对PyTorch的自动求导机制有了更深刻的理解。

# 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 容器

modelscope

|

5月前

|

博文

|

来自： ModelScope模型即服务

杭州六小龙最新开源「空间理解模型」，保姆级教程来了！

前几天，“杭州六小龙”之一「群核科技」在GTC 2025大会开源了空间理解模型：SpatialLM。

# 传感器 # 人工智能 # 机器人 # PyTorch # 算法框架/工具

hw2020hw

|

6月前

|

博文

昇腾 msmodelslim w8a8量化代码解析

msmodelslim w8a8量化算法原理和代码解析

# 云解析DNS # 算法 # PyTorch # 算法框架/工具 # Python

Deephub

|

6月前

|

博文

|

来自：大数据与机器学习

9个主流GAN损失函数的数学原理和Pytorch代码实现：从经典模型到现代变体

生成对抗网络（GAN）的训练效果高度依赖于损失函数的选择。本文介绍了经典GAN损失函数理论，并用PyTorch实现多种变体，包括原始GAN、LS-GAN、WGAN及WGAN-GP等。通过分析其原理与优劣，如LS-GAN提升训练稳定性、WGAN-GP改善图像质量，展示了不同场景下损失函数的设计思路。代码实现覆盖生成器与判别器的核心逻辑，为实际应用提供了重要参考。未来可探索组合优化与自适应设计以提升性能。

# 机器学习/深度学习 # JavaScript # PyTorch # 算法框架/工具 # 决策智能

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

TripoSR：开源3D生成闪电战！单图0.5秒建模，Stability AI颠覆设计流程

TripoSR是由Stability AI和VAST联合推出的开源3D生成模型，能在0.5秒内从单张2D图像快速生成高质量3D模型，支持游戏开发、影视制作等多领域应用。

# 视觉智能开放平台 # 人工智能 # 并行计算 # PyTorch # 数据处理 # 异构计算

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

MoshiVis：语音视觉实时交互开源！7B模型秒懂图像，无障碍革命来袭

MoshiVis 是 Kyutai 推出的开源多模态语音模型，结合视觉与语音输入，支持实时交互，适用于无障碍应用、智能家居控制等多个场景。

# 智能语音交互 # 机器学习/深度学习 # 人工智能 # Rust # PyTorch # 算法框架/工具

游客7dgyrbdm3doqi

|

6月前

|

博文

NPU上如何使能pytorch图模式

本文介绍了PyTorch的`torch.compile`技术和TorchAir的相关内容。`torch.compile`通过将动态图转换为静态图并结合JIT编译，提升模型推理和训练效率。示例代码展示了如何使用`torch.compile`优化模型。TorchAir是昇腾为PyTorch提供的图模式扩展库，支持在昇腾设备上进行高效训练和推理。它基于Dynamo特性，将计算图转换为Ascend IR，并通过图引擎优化执行。文章还提供了TorchAir的使用示例及功能配置方法。

# PyTorch # 编译器 # 算法框架/工具 # AI芯片

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Instella：AMD开源30亿参数语言模型！训练效率碾压同级选手

Instella是AMD推出的30亿参数开源语言模型，基于自回归Transformer架构，支持多轮对话、指令跟随和自然语言理解，适用于智能客服、内容创作和教育辅导等多个领域。

# 自然语言处理 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具 # 异构计算

Deephub

|

6月前

|

博文

|

来自：大数据与机器学习

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题，文章提出利用UCC和UCX等统一通信框架实现高效数据传输，并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战，如计算能力不平衡、内存容量差异及通信性能优化，文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性，但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开，供读者参考实践。

# GPU云服务器 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算 # 容器

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Hunyuan3D 2.0：腾讯混元开源3D生成大模型！图生/文生秒建高精度模型，细节纹理自动合成

Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统，专注于从文本和图像生成高分辨率的 3D 模型，支持几何生成和纹理合成。

# 图像识别 # 人工智能 # PyTorch # API # 算法框架/工具 # 图形学

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch