PyTorch的搜索结果_文章_第11页-阿里云开发者社区

Deephub

|

6月前

|

博文

|

本文探讨了将标准Transformer架构应用于连续值时间序列数据的最小化调整方案，提出了极简时间序列Transformer（MiTS-Transformer）和位置编码扩展时间序列Transformer（PoTS-Transformer）。通过替换嵌入层为线性映射层，MiTS-Transformer实现了对正弦波序列的有效学习。而PoTS-Transformer则通过在高维空间中进行位置编码，结合低维模型架构，解决了长序列处理与过拟合问题。实验结果表明，这两种模型在不同类型的时间序列预测任务中表现出色，为基于Transformer的时间序列预测提供了高效基准方案。

# 机器学习/深度学习 # PyTorch # 调度 # 区块链 # 算法框架/工具

wxchyy-39337

|

6月前

|

博文

|

来自：大数据与机器学习

小白避坑指南：国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录（附镜像加速方案）

本文详细记录了使用Colossal-Ai对DeepSeek-Qwen模型进行微调的过程，包括模型下载、环境部署、数据集处理及代码实现等环节。重点介绍了LoRA低秩适配方法和Colossal-Ai分布式训练框架的使用技巧，解决了模型封装后函数调用冲突、梯度检查点配置等问题。通过命令行参数灵活调整训练配置，最终在两块A100 GPU上完成训练，单卡显存占用约11GB，利用率达85%。文章总结了常见问题及解决方法，为后续研究提供参考。

# 人工智能平台 PAI # 机器学习/深度学习 # 物联网 # PyTorch # API # 异构计算

Deephub

|

6月前

|

博文

|

来自：大数据与机器学习

PyTorch PINN实战：用深度学习求解微分方程

物理信息神经网络（PINN）是一种将深度学习与物理定律结合的创新方法，特别适用于微分方程求解。传统神经网络依赖大规模标记数据，而PINN通过将微分方程约束嵌入损失函数，显著提高数据效率。它能在流体动力学、量子力学等领域实现高效建模，弥补了传统数值方法在高维复杂问题上的不足。尽管计算成本较高且对超参数敏感，PINN仍展现出强大的泛化能力和鲁棒性，为科学计算提供了新路径。文章详细介绍了PINN的工作原理、技术优势及局限性，并通过Python代码演示了其在微分方程求解中的应用，验证了其与解析解的高度一致性。

# 机器学习/深度学习 # 自然语言处理 # 算法 # PyTorch # 算法框架/工具

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Chat2SVG – 文本描述实现高质量矢量图形的生成框架

Chat2SVG 是一个创新的文本到矢量图形生成框架，结合大型语言模型和图像扩散模型，通过多阶段流程生成高质量的 SVG 图形，支持自然语言指令编辑，适用于设计、教育和艺术创作等领域。

# 自然语言处理 # 人工智能 # 自然语言处理 # PyTorch # API # 算法框架/工具

阿里云开发者

|

6月前

|

博文

ComfyUI：搭积木一样构建专属于自己的AIGC工作流（保姆级教程）

通过本篇文章，你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流。

# 人工智能 # 算法 # 物联网 # PyTorch # Python

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

NotaGen：中央音乐学院联合清华推出AI音乐生成模型，古典乐谱一键生成，音乐性接近人类！

NotaGen 是由中央音乐学院、北京航空航天大学、清华大学等机构联合推出的音乐生成模型，基于模仿大型语言模型的训练范式，能够生成高质量的古典乐谱。该模型通过预训练、微调和强化学习相结合的方式，显著提升了符号音乐生成的艺术性和可控性。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 并行计算 # 算法 # PyTorch

Deephub

|

6月前

|

博文

|

来自：大数据与机器学习

深入解析图神经网络注意力机制：数学原理与可视化实现

本文深入解析了图神经网络（GNNs）中自注意力机制的内部运作原理，通过可视化和数学推导揭示其工作机制。文章采用“位置-转移图”概念框架，并使用NumPy实现代码示例，逐步拆解自注意力层的计算过程。文中详细展示了从节点特征矩阵、邻接矩阵到生成注意力权重的具体步骤，并通过四个类（GAL1至GAL4）模拟了整个计算流程。最终，结合实际PyTorch Geometric库中的代码，对比分析了核心逻辑，为理解GNN自注意力机制提供了清晰的学习路径。

# 云解析DNS # 机器学习/深度学习 # 数据可视化 # PyTorch # 索引 # Python

胖胖雕

|

6月前

|

博文

Windows下CUDA+pytorch安装

以下是关于在Windows下安装CUDA和PyTorch的简要介绍及参考链接：

# 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

AIMv2：苹果开源多模态视觉模型，自回归预训练革新图像理解

AIMv2 是苹果公司开源的多模态自回归预训练视觉模型，通过图像和文本的深度融合提升视觉模型的性能，适用于多种视觉和多模态任务。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 编解码 # PyTorch # 算法框架/工具

Deephub

|

6月前

|

博文

|

来自：大数据与机器学习

PyTorch内存优化的10种策略总结：在有限资源环境下高效训练模型

在大规模深度学习模型训练中，GPU内存容量常成为瓶颈，特别是在训练大型语言模型和视觉Transformer时。本文系统介绍了多种内存优化策略，包括混合精度训练、低精度训练（如BF16）、梯度检查点、梯度累积、张量分片与分布式训练、

# 机器学习/深度学习 # 存储 # PyTorch # 算法框架/工具 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch