PyTorch的搜索结果_第7页-阿里云开发者社区

Echo_Wish

|

6月前

|

博文

|

来自：大数据与机器学习

模型复现翻车的第一现场：不是代码，而是你没管好训练数据

# SQL # 算法 # 搜索推荐 # 数据管理 # PyTorch

Deephub

|

6月前

|

博文

让 Q 值估计更准确：从 DQN 到 Double DQN 的改进方案

本文深入剖析DQN的过估计偏差根源，系统讲解Double DQN（解耦动作选择与评估）、Dueling DQN（分离状态值与动作优势）、优先经验回放（按TD误差智能采样）三大核心改进，并用PyTorch从零实现，最后对比CleanRL专业实现，助你扎实掌握强化学习进阶技巧。

# 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # C++

心枢AI研习社

|

6月前

|

博文

ComfyUI 安装踩坑全记录：Python 版本冲突、CUDA 报错、GitHub 拉取失败如何解决

本文详述Windows下ComfyUI环境配置的典型“雪崩式”故障：Python多版本冲突（3.10/3.11/3.14）、CUDA与PyTorch错配、启动器脱离venv、Git失效及GitHub插件（Impact-Pack/SAM2）因网络不稳定反复拉取失败。核心揭示——问题根源不在技术细节，而在各工具对“干净系统”的隐含假设彼此冲突。全文聚焦实操解法：强制指定venv路径、精准安装cu121版PyTorch、独立配置Git代理，并强调“信venv、不信系统Python”的关键原则。助力新手快速避坑、稳态运行。（239字）

# 并行计算 # PyTorch # 开发工具 # git # Python

AI未闻花名

|

6月前

|

博文

|

来自：千问大模型

大模型应用：概率驱动：大模型文字预测的核心机制与理论基础.5

本文深入浅出地解析大模型文字预测原理：将文本编码为向量，通过Transformer自注意力机制建模上下文，输出下一字/词的概率分布；详述预训练（海量文本填空学习）与微调过程，并以PyTorch代码实例展示字符级RNN/Transformer预测全流程。

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具

大模型探员

|

6月前

|

博文

告别“左右横跳”：深度强化学习PPO算法为何是训练AI的黄金准则？

本文深入浅出地解析了深度强化学习中的PPO算法，从原理到实战，手把手教你用PyTorch实现倒立摆控制。揭秘PPO为何成为OpenAI的“看家本领”，适合想入门DRL的开发者与爱好者。

# 机器学习/深度学习 # 人工智能 # 算法 # PyTorch # 算法框架/工具

大模型探员

|

6月前

|

博文

AI时代的“义务教育”：深度拆解LLM预训练核心原理与PyTorch源码实现

本文深入解析大模型预训练核心，以Qwen2.5为例，从Tokenizer、RoPE位置编码到GQA注意力机制，拆解LLM如何通过海量数据“炼”成。涵盖架构演进、关键技术与代码实现，带你手把手理解大模型“义务教育”阶段的底层逻辑。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具

游客frwjvlzyati3g

|

6月前

|

问答

|

来自： ModelScope模型即服务

使用modelscope使用ROCm上运行大模型测试时的out of memory问题

# 人工智能 # 算法框架/工具 # PyTorch # 测试技术

大模型玩家七七

|

6月前

|

博文

|

来自：数据库

告别盲目试错！大模型微调核心参数的“油门、档位与里程

本文深入浅出讲解大模型微调三大核心参数：学习率、batch_size、epochs，类比“油门、档位、里程”，帮助新手理解其作用与配合逻辑。结合PyTorch实操案例，提供从基础设置到单参数优化的完整流程，并分享避坑指南与效果评估方法，助力告别盲目试错，实现高效稳定微调。

# 自然语言处理 # 数据可视化 # 安全 # PyTorch # 算法框架/工具

大模型玩家七七

|

6月前

|

博文

|

来自：数据库

不用换显卡！大模型微调显存优化实操指南（附代码+效果对比）

不用换显卡！本文详解三大显存优化技巧：梯度检查点、混合精度训练、动态批量调整，附PyTorch实操代码与效果对比。16G显卡成功微调Llama 2 7B，显存占用直降38.5%，精度几乎无损，学生党、个人开发者也能轻松上手。

# 存储 # 物联网 # PyTorch # 算法框架/工具 # 决策智能

大模型玩家七七

|

6月前

|

博文

|

来自：云原生

16G显卡也能调大模型？先搞懂显存消耗的3大核心原因

本文深入解析大模型微调中显存消耗的三大主因：模型参数、中间激活值与优化器状态，结合原理与实操，教你用16G显卡高效调参。通过精度优化、批大小调整与低显存优化器等策略，精准定位OOM问题，平衡显存、速度与精度，助力中小开发者低成本入门大模型微调。

# 存储 # 自然语言处理 # 物联网 # PyTorch # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch