PyTorch

首页 标签 PyTorch
# PyTorch #
关注
4947内容
|
4小时前
|
AI时代的“义务教育”:深度拆解LLM预训练核心原理与PyTorch源码实现
本文深入解析大模型预训练核心,以Qwen2.5为例,从Tokenizer、RoPE位置编码到GQA注意力机制,拆解LLM如何通过海量数据“炼”成。涵盖架构演进、关键技术与代码实现,带你手把手理解大模型“义务教育”阶段的底层逻辑。
|
1天前
| |
来自: 数据库
告别盲目试错!大模型微调核心参数的“油门、档位与里程
本文深入浅出讲解大模型微调三大核心参数:学习率、batch_size、epochs,类比“油门、档位、里程”,帮助新手理解其作用与配合逻辑。结合PyTorch实操案例,提供从基础设置到单参数优化的完整流程,并分享避坑指南与效果评估方法,助力告别盲目试错,实现高效稳定微调。
|
1天前
| |
来自: 数据库
不用换显卡!大模型微调显存优化实操指南(附代码+效果对比)
不用换显卡!本文详解三大显存优化技巧:梯度检查点、混合精度训练、动态批量调整,附PyTorch实操代码与效果对比。16G显卡成功微调Llama 2 7B,显存占用直降38.5%,精度几乎无损,学生党、个人开发者也能轻松上手。
|
1天前
| |
来自: 云原生
16G显卡也能调大模型?先搞懂显存消耗的3大核心原因
本文深入解析大模型微调中显存消耗的三大主因:模型参数、中间激活值与优化器状态,结合原理与实操,教你用16G显卡高效调参。通过精度优化、批大小调整与低显存优化器等策略,精准定位OOM问题,平衡显存、速度与精度,助力中小开发者低成本入门大模型微调。
构建AI智能体:九十四、Hugging Face 与 Transformers 完全指南:解锁现代 NLP 的强大力量
Hugging Face 是领先的自然语言处理开源平台,提供 Transformers 等核心库,支持数千种预训练模型,涵盖文本分类、生成、问答等任务。其 Pipeline 工具简化了模型调用,AutoClass 实现架构自动识别,助力开发者高效构建 AI 应用。
|
4天前
|
PyTorch Docker 容器化部署与生产运行实践
本文详细介绍PyTorch的Docker容器化部署方案,涵盖环境准备、镜像拉取、测试与生产环境分级部署、功能验证及优化建议。强调版本固定、非root运行、资源限制与健康检查,结合轩辕镜像加速,确保安全、稳定、高效的深度学习开发与生产环境。
GLM-4V-9B 视觉多模态模型本地部署教程【保姆级教程】
本教程详细介绍如何在Linux服务器上本地部署智谱AI的GLM-4V-9B视觉多模态模型,涵盖环境配置、模型下载、推理代码及4-bit量化、vLLM加速等优化方案,助力高效实现图文理解与私有化应用。
|
9天前
|
神经辐射场NeRF入门:3D视图合成的原理与PyTorch代码实现
NeRF(神经辐射场)用多层感知机将5D坐标(位置+视角)映射为颜色和密度,通过过拟合单个场景实现高质量新视角合成。结合位置编码与体积渲染,以隐式方式表征三维场景,仅需少量图像即可重建精细结构。
免费试用