PyTorch的搜索结果_第15页-阿里云开发者社区

Deephub

|

7月前

|

博文

|

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题，文章提出利用UCC和UCX等统一通信框架实现高效数据传输，并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战，如计算能力不平衡、内存容量差异及通信性能优化，文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性，但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开，供读者参考实践。

# GPU云服务器 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算 # 容器

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Hunyuan3D 2.0：腾讯混元开源3D生成大模型！图生/文生秒建高精度模型，细节纹理自动合成

Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统，专注于从文本和图像生成高分辨率的 3D 模型，支持几何生成和纹理合成。

# 图像识别 # 人工智能 # PyTorch # API # 算法框架/工具 # 图形学

Deephub

|

7月前

|

博文

|

来自：大数据与机器学习

MiTS与PoTS：面向连续值时间序列的极简Transformer架构

本文探讨了将标准Transformer架构应用于连续值时间序列数据的最小化调整方案，提出了极简时间序列Transformer（MiTS-Transformer）和位置编码扩展时间序列Transformer（PoTS-Transformer）。通过替换嵌入层为线性映射层，MiTS-Transformer实现了对正弦波序列的有效学习。而PoTS-Transformer则通过在高维空间中进行位置编码，结合低维模型架构，解决了长序列处理与过拟合问题。实验结果表明，这两种模型在不同类型的时间序列预测任务中表现出色，为基于Transformer的时间序列预测提供了高效基准方案。

# 机器学习/深度学习 # PyTorch # 调度 # 区块链 # 算法框架/工具

wxchyy-39337

|

7月前

|

博文

|

来自：大数据与机器学习

小白避坑指南：国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录（附镜像加速方案）

本文详细记录了使用Colossal-Ai对DeepSeek-Qwen模型进行微调的过程，包括模型下载、环境部署、数据集处理及代码实现等环节。重点介绍了LoRA低秩适配方法和Colossal-Ai分布式训练框架的使用技巧，解决了模型封装后函数调用冲突、梯度检查点配置等问题。通过命令行参数灵活调整训练配置，最终在两块A100 GPU上完成训练，单卡显存占用约11GB，利用率达85%。文章总结了常见问题及解决方法，为后续研究提供参考。

# 人工智能平台 PAI # 机器学习/深度学习 # 物联网 # PyTorch # API # 异构计算

Deephub

|

7月前

|

博文

|

来自：大数据与机器学习

PyTorch PINN实战：用深度学习求解微分方程

物理信息神经网络（PINN）是一种将深度学习与物理定律结合的创新方法，特别适用于微分方程求解。传统神经网络依赖大规模标记数据，而PINN通过将微分方程约束嵌入损失函数，显著提高数据效率。它能在流体动力学、量子力学等领域实现高效建模，弥补了传统数值方法在高维复杂问题上的不足。尽管计算成本较高且对超参数敏感，PINN仍展现出强大的泛化能力和鲁棒性，为科学计算提供了新路径。文章详细介绍了PINN的工作原理、技术优势及局限性，并通过Python代码演示了其在微分方程求解中的应用，验证了其与解析解的高度一致性。

# 机器学习/深度学习 # 自然语言处理 # 算法 # PyTorch # 算法框架/工具

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Chat2SVG – 文本描述实现高质量矢量图形的生成框架

Chat2SVG 是一个创新的文本到矢量图形生成框架，结合大型语言模型和图像扩散模型，通过多阶段流程生成高质量的 SVG 图形，支持自然语言指令编辑，适用于设计、教育和艺术创作等领域。

# 自然语言处理 # 人工智能 # 自然语言处理 # PyTorch # API # 算法框架/工具

阿里云开发者

|

7月前

|

博文

ComfyUI：搭积木一样构建专属于自己的AIGC工作流（保姆级教程）

通过本篇文章，你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流。

# 人工智能 # 算法 # 物联网 # PyTorch # Python

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

NotaGen：中央音乐学院联合清华推出AI音乐生成模型，古典乐谱一键生成，音乐性接近人类！

NotaGen 是由中央音乐学院、北京航空航天大学、清华大学等机构联合推出的音乐生成模型，基于模仿大型语言模型的训练范式，能够生成高质量的古典乐谱。该模型通过预训练、微调和强化学习相结合的方式，显著提升了符号音乐生成的艺术性和可控性。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 并行计算 # 算法 # PyTorch

Deephub

|

7月前

|

博文

|

来自：大数据与机器学习

深入解析图神经网络注意力机制：数学原理与可视化实现

本文深入解析了图神经网络（GNNs）中自注意力机制的内部运作原理，通过可视化和数学推导揭示其工作机制。文章采用“位置-转移图”概念框架，并使用NumPy实现代码示例，逐步拆解自注意力层的计算过程。文中详细展示了从节点特征矩阵、邻接矩阵到生成注意力权重的具体步骤，并通过四个类（GAL1至GAL4）模拟了整个计算流程。最终，结合实际PyTorch Geometric库中的代码，对比分析了核心逻辑，为理解GNN自注意力机制提供了清晰的学习路径。

# 云解析DNS # 机器学习/深度学习 # 数据可视化 # PyTorch # 索引 # Python

胖胖雕

|

7月前

|

博文

Windows下CUDA+pytorch安装

以下是关于在Windows下安装CUDA和PyTorch的简要介绍及参考链接：

# 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch