算法框架/工具

首页 标签 算法框架/工具
# 算法框架/工具 #
关注
10874内容
大模型显存优化实战手册:如何用有限显卡训练百亿参数模型?
AI博主maoku详解大模型显存优化:直击OOM痛点,拆解参数/梯度/优化器/激活值四大显存“大户”,揭秘1:1:6内存占比规律;实操九大技巧——梯度检查点、BF16混合精度、CPU卸载、算子融合等,并验证8卡80G全量微调72B模型的落地效果。省钱、提效、普惠,一文掌握显存优化核心方法论。(239字)
TensorRT 模型加速——输入、输出、部署流程
本文首先简要介绍 Tensor RT 的输入、输出以及部署流程,了解 Tensor RT 在部署模型中起到的作用。然后介绍 Tensor RT 模型导入流程,针对不同的深度学习框架,使用不同的方法导入模型。
Pytorch学习笔记(二):nn.Conv2d()函数详解
这篇文章是关于PyTorch中nn.Conv2d函数的详解,包括其函数语法、参数解释、具体代码示例以及与其他维度卷积函数的区别。
阿里云服务器ECS是什么?可以用来做什么?图文形式教你看懂云服务器ECS
对于还未使用过云服务器ECS产品的用户来说,什么是云服务器ECS? 云服务器ECS可以用来做什么?与传统物理服务器相比,云服务器ECS的优势在哪里? 是新手用户比较关心的问题,下文通过图文形式教你看懂云服务器ECS。
免费试用