PyTorch的搜索结果-阿里云开发者社区

游客7dgyrbdm3doqi

|

22小时前

|

博文

本文介绍了PyTorch的`torch.compile`技术和TorchAir的相关内容。`torch.compile`通过将动态图转换为静态图并结合JIT编译，提升模型推理和训练效率。示例代码展示了如何使用`torch.compile`优化模型。TorchAir是昇腾为PyTorch提供的图模式扩展库，支持在昇腾设备上进行高效训练和推理。它基于Dynamo特性，将计算图转换为Ascend IR，并通过图引擎优化执行。文章还提供了TorchAir的使用示例及功能配置方法。

# PyTorch # 编译器 # 算法框架/工具 # AI芯片

蚝油菜花

|

4天前

|

博文

|

来自： ModelScope模型即服务

Instella：AMD开源30亿参数语言模型！训练效率碾压同级选手

Instella是AMD推出的30亿参数开源语言模型，基于自回归Transformer架构，支持多轮对话、指令跟随和自然语言理解，适用于智能客服、内容创作和教育辅导等多个领域。

# 自然语言处理 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具 # 异构计算

Deephub

|

6天前

|

博文

|

来自：大数据与机器学习

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题，文章提出利用UCC和UCX等统一通信框架实现高效数据传输，并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战，如计算能力不平衡、内存容量差异及通信性能优化，文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性，但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开，供读者参考实践。

# GPU云服务器 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算 # 容器

蚝油菜花

|

6天前

|

博文

|

来自： ModelScope模型即服务

Hunyuan3D 2.0：腾讯混元开源3D生成大模型！图生/文生秒建高精度模型，细节纹理自动合成

Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统，专注于从文本和图像生成高分辨率的 3D 模型，支持几何生成和纹理合成。

# 图像识别 # 人工智能 # PyTorch # API # 算法框架/工具 # 图形学

Deephub

|

9天前

|

博文

|

来自：大数据与机器学习

MiTS与PoTS：面向连续值时间序列的极简Transformer架构

本文探讨了将标准Transformer架构应用于连续值时间序列数据的最小化调整方案，提出了极简时间序列Transformer（MiTS-Transformer）和位置编码扩展时间序列Transformer（PoTS-Transformer）。通过替换嵌入层为线性映射层，MiTS-Transformer实现了对正弦波序列的有效学习。而PoTS-Transformer则通过在高维空间中进行位置编码，结合低维模型架构，解决了长序列处理与过拟合问题。实验结果表明，这两种模型在不同类型的时间序列预测任务中表现出色，为基于Transformer的时间序列预测提供了高效基准方案。

# 机器学习/深度学习 # PyTorch # 调度 # 区块链 # 算法框架/工具

wxchyy

|

9天前

|

博文

|

来自：大数据与机器学习

小白避坑指南：国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录（附镜像加速方案）

本文详细记录了使用Colossal-Ai对DeepSeek-Qwen模型进行微调的过程，包括模型下载、环境部署、数据集处理及代码实现等环节。重点介绍了LoRA低秩适配方法和Colossal-Ai分布式训练框架的使用技巧，解决了模型封装后函数调用冲突、梯度检查点配置等问题。通过命令行参数灵活调整训练配置，最终在两块A100 GPU上完成训练，单卡显存占用约11GB，利用率达85%。文章总结了常见问题及解决方法，为后续研究提供参考。

# 人工智能平台 PAI # 机器学习/深度学习 # 物联网 # PyTorch # API # 异构计算

Deephub

|

11天前

|

博文

|

来自：大数据与机器学习

PyTorch PINN实战：用深度学习求解微分方程

物理信息神经网络（PINN）是一种将深度学习与物理定律结合的创新方法，特别适用于微分方程求解。传统神经网络依赖大规模标记数据，而PINN通过将微分方程约束嵌入损失函数，显著提高数据效率。它能在流体动力学、量子力学等领域实现高效建模，弥补了传统数值方法在高维复杂问题上的不足。尽管计算成本较高且对超参数敏感，PINN仍展现出强大的泛化能力和鲁棒性，为科学计算提供了新路径。文章详细介绍了PINN的工作原理、技术优势及局限性，并通过Python代码演示了其在微分方程求解中的应用，验证了其与解析解的高度一致性。

# 机器学习/深度学习 # 自然语言处理 # 算法 # PyTorch # 算法框架/工具

蚝油菜花

|

11天前

|

博文

|

来自： ModelScope模型即服务

GaussianAnything：多模态3D生成黑科技！南洋理工开源框架秒建可编辑高精度模型

GaussianAnything 是由南洋理工大学 S-Lab 和上海 AI Lab 联合推出的 3D 生成框架，支持多模态输入，能够生成高质量、可编辑的 3D 模型，广泛应用于游戏、影视、VR/AR 等领域。

# 图像识别 # 人工智能 # 编解码 # PyTorch # vr&ar # 算法框架/工具

蚝油菜花

|

18天前

|

博文

|

来自： ModelScope模型即服务

Chat2SVG – 文本描述实现高质量矢量图形的生成框架

Chat2SVG 是一个创新的文本到矢量图形生成框架，结合大型语言模型和图像扩散模型，通过多阶段流程生成高质量的 SVG 图形，支持自然语言指令编辑，适用于设计、教育和艺术创作等领域。

# 自然语言处理 # 人工智能 # 自然语言处理 # PyTorch # API # 算法框架/工具

阿里云开发者

|

18天前

|

博文

ComfyUI：搭积木一样构建专属于自己的AIGC工作流（保姆级教程）

通过本篇文章，你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流。

# 人工智能 # 算法 # 物联网 # PyTorch # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch