PyTorch的搜索结果_第15页-阿里云开发者社区

Deephub

|

8月前

|

博文

|

本文深入探讨了PyTorch中GPU内存管理的核心机制，特别是CUDA缓存分配器的作用与优化策略。文章分析了常见的“CUDA out of memory”问题及其成因，并通过实际案例（如Llama 1B模型训练）展示了内存分配模式。PyTorch的缓存分配器通过内存池化、延迟释放和碎片化优化等技术，显著提升了内存使用效率，减少了系统调用开销。此外，文章还介绍了高级优化方法，包括混合精度训练、梯度检查点技术及自定义内存分配器配置。这些策略有助于开发者在有限硬件资源下实现更高性能的深度学习模型训练与推理。

# GPU云服务器 # 缓存 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

游客jnstwksgqnrgi

|

8月前

|

博文

|

来自：大数据与机器学习

PeptideBERT:基于Transformer用于肽性质预测的语言模型

本文介绍了PeptideBERT模型及其在昇腾设备上的部署方法。PeptideBERT是一种基于Transformer架构的蛋白质语言模型，通过微调预训练模型ProtBERT，可预测肽的溶血性、溶解性和抗非特异性吸附性等关键性质。其输入表示包括词嵌入、物理化学属性编码和位置编码，并采用多头自注意力机制捕捉序列依赖关系。

# 机器学习/深度学习 # 人工智能 # 算法 # PyTorch # Python

modelscope

|

8月前

|

博文

|

来自： ModelScope模型即服务

智源开源FlagOS升级：首次实现DeepSeek-R1满血版多种芯片高效快速部署

近日，DeepSeek-R1以低训练成本实现比肩一流模型的高性能并全面开源，引发了海量部署及场景应用，推理计算需求迅猛增长。

# 自然语言处理 # 并行计算 # PyTorch # 芯片 # AI芯片

深圳快瞳科技有限公司

|

8月前

|

博文

|

来自：大数据与机器学习

AI鱼类识别技术原理及示例代码

本文详细解析了AI鱼类识别的代码示例，涵盖深度学习框架选择、数据集处理、模型构建与训练优化全流程。内容包括技术选型对比（如TensorFlow、PyTorch、YOLO系列）、数据准备流程（开源数据集与标注规范）、完整代码示例（以PyTorch版ResNet50改进模型为例）以及模型优化策略（如量化压缩、知识蒸馏）。此外，还提供了典型应用场景（如渔业资源监测系统）、模型评估指标及开源项目推荐，并针对常见问题（小样本、水下模糊、类别不平衡等）提出解决方案。

# 机器学习/深度学习 # 人工智能 # 算法 # PyTorch # 算法框架/工具

Deephub

|

8月前

|

博文

|

来自：大数据与机器学习

英伟达新一代GPU架构（50系列显卡）PyTorch兼容性解决方案

本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题，分析其根源为预编译二进制文件不支持sm_120架构，并提出解决方案：使用PyTorch Nightly版本、更新CUDA工具包至12.8。通过清理环境并安装支持新架构的组件，成功解决兼容性问题。文章总结了深度学习环境中硬件与框架兼容性的关键策略，强调Nightly构建版本和环境一致性的重要性，为开发者提供参考。

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

lorelai

|

8月前

|

博文

|

来自：大数据与机器学习

【pytorch】【202504】关于torch.nn.Linear

小白从开始这段代码展示了`nn.Linear`的使用及其背后的原理。此外，小白还深入研究了PyTorch的核心类`torch.nn.Module`以及其子类`torch.nn.Linear`的源码。`grad_fn`作为张量的一个属性，用于指导反向传播进一步地，小白探讨了`requires_grad`与叶子节点（leaf tensor）的关系。叶子节点是指在计算图中没有前驱操作的张量，只有设置了`requires_grad=True`的叶子节点才会在反向传播时保存梯度。最后，小白学习了PyTorch中的三种梯度模式通过以上学习小白对PyTorch的自动求导机制有了更深刻的理解。

# 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 容器

modelscope

|

8月前

|

博文

|

来自： ModelScope模型即服务

杭州六小龙最新开源「空间理解模型」，保姆级教程来了！

前几天，“杭州六小龙”之一「群核科技」在GTC 2025大会开源了空间理解模型：SpatialLM。

# 传感器 # 人工智能 # 机器人 # PyTorch # 算法框架/工具

hw2020hw

|

9月前

|

博文

昇腾 msmodelslim w8a8量化代码解析

msmodelslim w8a8量化算法原理和代码解析

# 云解析DNS # 算法 # PyTorch # 算法框架/工具 # Python

Deephub

|

9月前

|

博文

|

来自：大数据与机器学习

9个主流GAN损失函数的数学原理和Pytorch代码实现：从经典模型到现代变体

生成对抗网络（GAN）的训练效果高度依赖于损失函数的选择。本文介绍了经典GAN损失函数理论，并用PyTorch实现多种变体，包括原始GAN、LS-GAN、WGAN及WGAN-GP等。通过分析其原理与优劣，如LS-GAN提升训练稳定性、WGAN-GP改善图像质量，展示了不同场景下损失函数的设计思路。代码实现覆盖生成器与判别器的核心逻辑，为实际应用提供了重要参考。未来可探索组合优化与自适应设计以提升性能。

# 机器学习/深度学习 # JavaScript # PyTorch # 算法框架/工具 # 决策智能

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

TripoSR：开源3D生成闪电战！单图0.5秒建模，Stability AI颠覆设计流程

TripoSR是由Stability AI和VAST联合推出的开源3D生成模型，能在0.5秒内从单张2D图像快速生成高质量3D模型，支持游戏开发、影视制作等多领域应用。

# 视觉智能开放平台 # 人工智能 # 并行计算 # PyTorch # 数据处理 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch