PyTorch

首页 标签 PyTorch
# PyTorch #
关注
4933内容
|
3天前
|
PyTorch推理扩展实战:用Ray Data轻松实现多机多卡并行
单机PyTorch推理难以应对海量数据,内存、GPU利用率、I/O成瓶颈。Ray Data提供轻量方案,仅需微调代码,即可将原有推理逻辑无缝扩展至分布式,支持自动批处理、多机并行、容错与云存储集成,大幅提升吞吐效率,轻松应对百万级图像处理。
|
4天前
|
JAX核心设计解析:函数式编程让代码更可控
JAX采用函数式编程,参数与模型分离,随机数需显式传递key,确保无隐藏状态。这使函数行为可预测,便于自动微分、编译优化与分布式训练,虽初学略显繁琐,但在科研、高精度仿真等场景下更具可控性与可复现优势。
机器学习:模型训练术语大扫盲——别再混淆Step、Epoch和Iter等
本文用通俗类比讲清机器学习核心术语:Epoch是完整训练一轮,Batch Size是每次训练的数据量,Step/Iter是每批数据处理及参数更新的最小单位。结合学习率、损失值、过拟合等概念,帮你快速掌握训练过程关键要点,打通术语任督二脉。(238字)
|
5天前
|
openEuler操作系统环境:研发人脸识别软件与系统性能评估
openEuler 24.03 LTS是首个AI原生操作系统,集成PyTorch、TensorFlow等框架,支持主流AI模型高效部署。依托容器化技术与内核级优化,实现人脸识别等场景高性能运行,结合边缘计算与软硬协同设计,显著提升AI应用开发与部署效率,助力构建开放、高效的AI生态。
|
18天前
|
JAX 核心特性详解:纯函数、JIT 编译、自动微分等十大必知概念
JAX是Google与NVIDIA联合开发的高性能数值计算库,依托XLA实现CPU/GPU/TPU加速,支持自动微分、JIT编译、向量化与并行化。生态丰富,含Flax、Optax等工具,适合深度学习与科学计算。
|
21天前
|
PyTorch 分布式训练底层原理与 DDP 实战指南
深度学习模型规模激增,如Llama 3.1达4050亿参数,单卡训练需数百年。并行计算通过多GPU协同解决此问题。本文详解PyTorch的分布式数据并行(DDP),涵盖原理、通信机制与代码实战,助你高效实现多卡训练。
基于YOLOv8的牛行为检测识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目通过 YOLOv8 模型与 PyQt5 界面结合,实现了牛行为的高效识别与分类。5000张高质量标注数据保证了模型的准确性,多样化场景增强了泛化能力。系统简单易用,支持图片、视频、摄像头多种输入方式,为智能养殖和畜牧管理提供了高效工具。无论是科研实验还是实际牧场监控,本项目都可快速部署,开箱即用。
|
1月前
|
从零训练一个 ChatGPT:用 PyTorch 构建自己的 LLM 模型
本文介绍如何使用PyTorch从零构建类似ChatGPT的大型语言模型,涵盖Transformer架构、数据预处理、训练优化及文本生成全过程,助你掌握LLM核心原理与实现技术。(238字)
|
1月前
|
从零实现3D Gaussian Splatting:完整渲染流程的PyTorch代码详解
3D高斯溅射(3DGS)正成为3D视觉新标准,广泛应用于AR/VR与实时渲染。本文用PyTorch在几百行代码内实现其核心渲染流程,涵盖投影、排序、分块与合成分步,效果媲美SOTA,助力快速理解与落地。
|
2月前
| |
TensorRT-LLM 推理服务实战指南
`trtllm-serve` 是 TensorRT-LLM 官方推理服务工具,支持一键部署兼容 OpenAI API 的生产级服务,提供模型查询、文本与对话补全等接口,并兼容多模态及分布式部署,助力高效推理。
免费试用