PyTorch的搜索结果_第4页-阿里云开发者社区

大模型玩家七七

|

4月前

|

博文

|

本文深入浅出讲解大模型微调三大核心参数：学习率、batch_size、epochs，类比“油门、档位、里程”，帮助新手理解其作用与配合逻辑。结合PyTorch实操案例，提供从基础设置到单参数优化的完整流程，并分享避坑指南与效果评估方法，助力告别盲目试错，实现高效稳定微调。

# 自然语言处理 # 数据可视化 # 安全 # PyTorch # 算法框架/工具

大模型玩家七七

|

4月前

|

博文

|

来自：数据库

不用换显卡！大模型微调显存优化实操指南（附代码+效果对比）

不用换显卡！本文详解三大显存优化技巧：梯度检查点、混合精度训练、动态批量调整，附PyTorch实操代码与效果对比。16G显卡成功微调Llama 2 7B，显存占用直降38.5%，精度几乎无损，学生党、个人开发者也能轻松上手。

# 存储 # 物联网 # PyTorch # 算法框架/工具 # 决策智能

大模型玩家七七

|

4月前

|

博文

|

来自：云原生

16G显卡也能调大模型？先搞懂显存消耗的3大核心原因

本文深入解析大模型微调中显存消耗的三大主因：模型参数、中间激活值与优化器状态，结合原理与实操，教你用16G显卡高效调参。通过精度优化、批大小调整与低显存优化器等策略，精准定位OOM问题，平衡显存、速度与精度，助力中小开发者低成本入门大模型微调。

# 存储 # 自然语言处理 # 物联网 # PyTorch # 异构计算

AI未闻花名

|

4月前

|

博文

|

来自： ModelScope模型即服务

构建AI智能体：九十四、Hugging Face 与 Transformers 完全指南：解锁现代 NLP 的强大力量

Hugging Face 是领先的自然语言处理开源平台，提供 Transformers 等核心库，支持数千种预训练模型，涵盖文本分类、生成、问答等任务。其 Pipeline 工具简化了模型调用，AutoClass 实现架构自动识别，助力开发者高效构建 AI 应用。

# 人工智能 # 自然语言处理 # PyTorch # API # 算法框架/工具

javaercn

|

4月前

|

博文

PyTorch Docker 容器化部署与生产运行实践

本文详细介绍PyTorch的Docker容器化部署方案，涵盖环境准备、镜像拉取、测试与生产环境分级部署、功能验证及优化建议。强调版本固定、非root运行、资源限制与健康检查，结合轩辕镜像加速，确保安全、稳定、高效的深度学习开发与生产环境。

# PyTorch # 算法框架/工具 # 异构计算 # Docker # 容器

代码bug生产队

|

4月前

|

博文

Python的优雅之道：为何开发者如此钟爱它？

# 机器学习/深度学习 # PyTorch # 算法框架/工具 # 开发者 # Python

ChenAI_TGF

|

4月前

|

博文

|

来自：大数据与机器学习

GLM-4V-9B 视觉多模态模型本地部署教程【保姆级教程】

本教程详细介绍如何在Linux服务器上本地部署智谱AI的GLM-4V-9B视觉多模态模型，涵盖环境配置、模型下载、推理代码及4-bit量化、vLLM加速等优化方案，助力高效实现图文理解与私有化应用。

# 人工智能 # PyTorch # Linux # API # 算法框架/工具

Deephub

|

4月前

|

博文

神经辐射场NeRF入门：3D视图合成的原理与PyTorch代码实现

NeRF（神经辐射场）用多层感知机将5D坐标（位置+视角）映射为颜色和密度，通过过拟合单个场景实现高质量新视角合成。结合位置编码与体积渲染，以隐式方式表征三维场景，仅需少量图像即可重建精细结构。

# 机器学习/深度学习 # 存储 # 编解码 # PyTorch # 算法框架/工具

Deephub

|

4月前

|

博文

Mosaic：面向超长序列的多GPU注意力分片方案

本文剖析Transformer中“二次方注意力瓶颈”的成因与工程破解之道，聚焦Mosaic提出的多轴注意力分片方案。针对长序列内存爆炸问题，Mosaic通过灵活路由不同轴至本地或分布式后端（如Ring、Mesh2D），实现高效计算与通信平衡，尤其适用于表格等多维数据场景，显著降低显存占用且不侵入模型代码。

# GPU云服务器 # 机器学习/深度学习 # PyTorch # 算法框架/工具 # 异构计算 # Python

hrjtfzpglando

|

5月前

|

博文

大模型在云上的训练与部署

本文系统阐述大模型在云上的训练与部署实践路径，涵盖发展趋势、GPU集群搭建、框架选型、数据处理、分布式训练、模型部署、成本优化及金融行业应用案例，全面解析云计算如何支撑大模型高效落地，并展望“大模型即服务”（MaaS）的未来生态。

# 弹性计算 # 监控 # PyTorch # 算法框架/工具 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch