蒋星熠Jaxonic

|

16天前

|

机器学习/深度学习 PyTorch TensorFlow

TensorFlow与PyTorch深度对比分析：从基础原理到实战选择的完整指南

蒋星熠Jaxonic，深度学习探索者。本文深度对比TensorFlow与PyTorch架构、性能、生态及应用场景，剖析技术选型关键，助力开发者在二进制星河中驾驭AI未来。

蒋星熠Jaxonic

201 13 13

网络AI

|

1月前

|

机器学习/深度学习数据采集人工智能

PyTorch学习实战：AI从数学基础到模型优化全流程精解

本文系统讲解人工智能、机器学习与深度学习的层级关系，涵盖PyTorch环境配置、张量操作、数据预处理、神经网络基础及模型训练全流程，结合数学原理与代码实践，深入浅出地介绍激活函数、反向传播等核心概念，助力快速入门深度学习。

网络AI

88 1 1

aliyun9170107523-43660

|

15天前

|

边缘计算人工智能 PyTorch

130_知识蒸馏技术：温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

随着大型语言模型（LLM）的规模不断增长，部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例，其671B参数的规模即使经过INT4量化后，仍需要至少6张高端GPU才能运行，这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术，通过将大型教师模型的知识迁移到小型学生模型中，在显著降低模型复杂度的同时保留核心性能，成为解决这一问题的关键技术之一。

aliyun9170107523-43660

169 6 6

Deephub

|

1月前

|

机器学习/深度学习存储 PyTorch

Neural ODE原理与PyTorch实现：深度学习模型的自适应深度调节

Neural ODE将神经网络与微分方程结合，用连续思维建模数据演化，突破传统离散层的限制，实现自适应深度与高效连续学习。

Deephub

77 3 3

Deephub

|

22天前

|

机器学习/深度学习自然语言处理 PyTorch

Transformer自回归关键技术：掩码注意力原理与PyTorch完整实现

掩码注意力是生成模型的核心，通过上三角掩码限制模型仅关注当前及之前token，确保自回归因果性。相比BERT的双向注意力，它实现单向生成，是GPT等模型逐词预测的关键机制，核心仅需一步`masked_fill_`操作。

Deephub

169 0 0

Deephub

|

2月前

|

PyTorch 算法框架/工具异构计算

PyTorch 2.0性能优化实战：4种常见代码错误严重拖慢模型

我们将深入探讨图中断（graph breaks）和多图问题对性能的负面影响，并分析PyTorch模型开发中应当避免的常见错误模式。

Deephub

166 9 10

aliyun9170107523-43660

|

15天前

|

机器学习/深度学习自然语言处理监控

23_Transformer架构详解：从原理到PyTorch实现

Transformer架构自2017年Google发表的论文《Attention Is All You Need》中提出以来，彻底改变了深度学习特别是自然语言处理领域的格局。在短短几年内，Transformer已成为几乎所有现代大型语言模型（LLM）的基础架构，包括BERT、GPT系列、T5等革命性模型。与传统的RNN和LSTM相比，Transformer通过自注意力机制实现了并行化训练，极大提高了模型的训练效率和性能。

aliyun9170107523-43660

191 0 0

Deephub

|

5月前

|

机器学习/深度学习 PyTorch API

PyTorch量化感知训练技术：模型压缩与高精度边缘部署实践

本文深入探讨神经网络模型量化技术，重点讲解训练后量化（PTQ）与量化感知训练（QAT）两种主流方法。PTQ通过校准数据集确定量化参数，快速实现模型压缩，但精度损失较大；QAT在训练中引入伪量化操作，使模型适应低精度环境，显著提升量化后性能。文章结合PyTorch实现细节，介绍Eager模式、FX图模式及PyTorch 2导出量化等工具，并分享大语言模型Int4/Int8混合精度实践。最后总结量化最佳策略，包括逐通道量化、混合精度设置及目标硬件适配，助力高效部署深度学习模型。

Deephub

735 21 26