PyTorch的搜索结果_文章_第18页-阿里云开发者社区

Deephub

|

11月前

|

博文

|

生成对抗网络（GAN）的训练效果高度依赖于损失函数的选择。本文介绍了经典GAN损失函数理论，并用PyTorch实现多种变体，包括原始GAN、LS-GAN、WGAN及WGAN-GP等。通过分析其原理与优劣，如LS-GAN提升训练稳定性、WGAN-GP改善图像质量，展示了不同场景下损失函数的设计思路。代码实现覆盖生成器与判别器的核心逻辑，为实际应用提供了重要参考。未来可探索组合优化与自适应设计以提升性能。

# 机器学习/深度学习 # JavaScript # PyTorch # 算法框架/工具 # 决策智能

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

TripoSR：开源3D生成闪电战！单图0.5秒建模，Stability AI颠覆设计流程

TripoSR是由Stability AI和VAST联合推出的开源3D生成模型，能在0.5秒内从单张2D图像快速生成高质量3D模型，支持游戏开发、影视制作等多领域应用。

# 视觉智能开放平台 # 人工智能 # 并行计算 # PyTorch # 数据处理 # 异构计算

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

MoshiVis：语音视觉实时交互开源！7B模型秒懂图像，无障碍革命来袭

MoshiVis 是 Kyutai 推出的开源多模态语音模型，结合视觉与语音输入，支持实时交互，适用于无障碍应用、智能家居控制等多个场景。

# 智能语音交互 # 机器学习/深度学习 # 人工智能 # Rust # PyTorch # 算法框架/工具

游客7dgyrbdm3doqi

|

11月前

|

博文

NPU上如何使能pytorch图模式

本文介绍了PyTorch的`torch.compile`技术和TorchAir的相关内容。`torch.compile`通过将动态图转换为静态图并结合JIT编译，提升模型推理和训练效率。示例代码展示了如何使用`torch.compile`优化模型。TorchAir是昇腾为PyTorch提供的图模式扩展库，支持在昇腾设备上进行高效训练和推理。它基于Dynamo特性，将计算图转换为Ascend IR，并通过图引擎优化执行。文章还提供了TorchAir的使用示例及功能配置方法。

# PyTorch # 编译器 # 算法框架/工具 # AI芯片

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Instella：AMD开源30亿参数语言模型！训练效率碾压同级选手

Instella是AMD推出的30亿参数开源语言模型，基于自回归Transformer架构，支持多轮对话、指令跟随和自然语言理解，适用于智能客服、内容创作和教育辅导等多个领域。

# 自然语言处理 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具 # 异构计算

Deephub

|

11月前

|

博文

|

来自：大数据与机器学习

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题，文章提出利用UCC和UCX等统一通信框架实现高效数据传输，并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战，如计算能力不平衡、内存容量差异及通信性能优化，文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性，但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开，供读者参考实践。

# GPU云服务器 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算 # 容器

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Hunyuan3D 2.0：腾讯混元开源3D生成大模型！图生/文生秒建高精度模型，细节纹理自动合成

Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统，专注于从文本和图像生成高分辨率的 3D 模型，支持几何生成和纹理合成。

# 图像识别 # 人工智能 # PyTorch # API # 算法框架/工具 # 图形学

Deephub

|

11月前

|

博文

|

来自：大数据与机器学习

MiTS与PoTS：面向连续值时间序列的极简Transformer架构

本文探讨了将标准Transformer架构应用于连续值时间序列数据的最小化调整方案，提出了极简时间序列Transformer（MiTS-Transformer）和位置编码扩展时间序列Transformer（PoTS-Transformer）。通过替换嵌入层为线性映射层，MiTS-Transformer实现了对正弦波序列的有效学习。而PoTS-Transformer则通过在高维空间中进行位置编码，结合低维模型架构，解决了长序列处理与过拟合问题。实验结果表明，这两种模型在不同类型的时间序列预测任务中表现出色，为基于Transformer的时间序列预测提供了高效基准方案。

# 机器学习/深度学习 # PyTorch # 调度 # 区块链 # 算法框架/工具

wxchyy-39337

|

11月前

|

博文

|

来自：大数据与机器学习

小白避坑指南：国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录（附镜像加速方案）

本文详细记录了使用Colossal-Ai对DeepSeek-Qwen模型进行微调的过程，包括模型下载、环境部署、数据集处理及代码实现等环节。重点介绍了LoRA低秩适配方法和Colossal-Ai分布式训练框架的使用技巧，解决了模型封装后函数调用冲突、梯度检查点配置等问题。通过命令行参数灵活调整训练配置，最终在两块A100 GPU上完成训练，单卡显存占用约11GB，利用率达85%。文章总结了常见问题及解决方法，为后续研究提供参考。

# 人工智能平台 PAI # 机器学习/深度学习 # 物联网 # PyTorch # API # 异构计算

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Chat2SVG – 文本描述实现高质量矢量图形的生成框架

Chat2SVG 是一个创新的文本到矢量图形生成框架，结合大型语言模型和图像扩散模型，通过多阶段流程生成高质量的 SVG 图形，支持自然语言指令编辑，适用于设计、教育和艺术创作等领域。

# 自然语言处理 # 人工智能 # 自然语言处理 # PyTorch # API # 算法框架/工具

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch