PyTorch的搜索结果_热门_第15页-阿里云开发者社区

TechLead

|

博文

机器学习-ROC曲线：技术解析与实战应用

# 云解析DNS # 机器学习/深度学习 # 自然语言处理 # PyTorch # 算法框架/工具 # Python

布客飞龙

|

博文

PyTorch 2.2 中文官方教程（九）（3）

PyTorch 2.2 中文官方教程（九）

# API # PyTorch # 算法框架/工具 # 编解码 # 计算机视觉

Echo_Wish

|

博文

|

来自：大数据与机器学习

使用Python实现长短时记忆网络（LSTM）的博客教程

# 机器学习/深度学习 # 数据挖掘 # PyTorch # 算法框架/工具 # Python

yuanzhengme

|

博文

Ultralytics是什么？

【8月更文挑战第3天】Ultralytics是什么？

# 机器学习/深度学习 # 监控 # 数据可视化 # PyTorch # 计算机视觉

郑小健

|

博文

|

来自：大数据与机器学习

强化学习实战：基于 PyTorch 的环境搭建与算法实现

【8月更文第29天】强化学习是机器学习的一个重要分支，它让智能体通过与环境交互来学习策略，以最大化长期奖励。本文将介绍如何使用PyTorch实现两种经典的强化学习算法——Deep Q-Network (DQN) 和 Actor-Critic Algorithm with Asynchronous Advantage (A3C)。我们将从环境搭建开始，逐步实现算法的核心部分，并给出完整的代码示例。

# 函数计算 # 机器学习/深度学习 # 存储 # 算法 # PyTorch # 算法框架/工具

土木林森

|

11月前

|

博文

掌握从零到一的进阶攻略：让你轻松成为BERT微调高手——详解模型微调全流程，含实战代码与最佳实践秘籍，助你应对各类NLP挑战！

【10月更文挑战第1天】随着深度学习技术的进步，预训练模型已成为自然语言处理（NLP）领域的常见实践。这些模型通过大规模数据集训练获得通用语言表示，但需进一步微调以适应特定任务。本文通过简化流程和示例代码，介绍了如何选择预训练模型（如BERT），并利用Python库（如Transformers和PyTorch）进行微调。文章详细说明了数据准备、模型初始化、损失函数定义及训练循环等关键步骤，并提供了评估模型性能的方法。希望本文能帮助读者更好地理解和实现模型微调。

# 自然语言处理 # 自然语言处理 # PyTorch # 算法框架/工具 # Python # 机器学习/深度学习

Deephub

|

9月前

|

博文

|

来自：大数据与机器学习

使用PyTorch实现GPT-2直接偏好优化训练：DPO方法改进及其与监督微调的效果对比

本文将系统阐述DPO的工作原理、实现机制，以及其与传统RLHF和SFT方法的本质区别。

# 机器学习/深度学习 # 人工智能 # PyTorch # 算法框架/工具 # 索引

Deephub

|

7月前

|

博文

|

来自：大数据与机器学习

DeepSeek 背后的技术：GRPO，基于群组采样的高效大语言模型强化学习训练方法详解

强化学习（RL）是提升大型语言模型（LLM）推理能力的重要手段，尤其在复杂推理任务中表现突出。DeepSeek团队通过群组相对策略优化（GRPO）方法，在DeepSeek-Math和DeepSeek-R1模型中取得了突破性成果，显著增强了数学推理和问题解决能力。GRPO无需价值网络，采用群组采样和相对优势估计，有效解决了传统RL应用于语言模型时的挑战，提升了训练效率和稳定性。实际应用中，DeepSeek-Math和DeepSeek-R1分别在数学推理和复杂推理任务中展现了卓越性能。未来研究将聚焦于改进优势估计、自适应超参数调整及理论分析，进一步拓展语言模型的能力边界。

# 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具

Deephub

|

4月前

|

博文

|

来自：大数据与机器学习

基于图神经网络的自然语言处理：融合LangGraph与大型概念模型的情感分析实践

本文探讨了在企业数字化转型中，大型概念模型（LCMs）与图神经网络结合处理非结构化文本数据的技术方案。LCMs突破传统词汇级处理局限，以概念级语义理解为核心，增强情感分析、实体识别和主题建模能力。通过构建基于LangGraph的混合符号-语义处理管道，整合符号方法的结构化优势与语义方法的理解深度，实现精准的文本分析。具体应用中，该架构通过预处理、图构建、嵌入生成及GNN推理等模块，完成客户反馈的情感分类与主题聚类。最终，LangGraph工作流编排确保各模块高效协作，为企业提供可解释性强、业务价值高的分析结果。此技术融合为挖掘非结构化数据价值、支持数据驱动决策提供了创新路径。

# 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 数据可视化 # 数据挖掘 # PyTorch

阿里云开发者

|

3月前

|

博文

从零开始200行python代码实现LLM

本文从零开始用Python实现了一个极简但完整的大语言模型，帮助读者理解LLM的工作原理。首先通过传统方法构建了一个诗词生成器，利用字符间的概率关系递归生成文本。接着引入PyTorch框架，逐步重构代码，实现了一个真正的Bigram模型。文中详细解释了词汇表（tokenizer）、张量（Tensor）、反向传播、梯度下降等关键概念，并展示了如何用Embedding层和线性层搭建模型。最终实现了babyGPT_v1.py，一个能生成类似诗词的简单语言模型。下一篇文章将在此基础上实现自注意力机制和完整的GPT模型。

# 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch