PyTorch的搜索结果_热门_第18页-阿里云开发者社区

郑小健

|

博文

【10月更文挑战第29天】作为一名机器学习爱好者，我深知在自然语言处理（NLP）领域，Transformer模型的重要性。自从2017年Google的研究团队提出Transformer以来，它迅速成为NLP领域的主流模型，广泛应用于机器翻译、文本生成、情感分析等多个任务。本文旨在为初学者提供一个全面的Transformers入门指南，介绍Transformer模型的基本概念、结构组成及其相对于传统RNN和CNN模型的优势。

# 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # PyTorch # 算法框架/工具

AI未闻花名

|

29天前

|

博文

|

来自：千问大模型

大模型应用：大模型算力优化方案：识别突破隐性瓶颈达到效能最大化.65

本文深度剖析大模型落地中“算力跑不满”的隐性瓶颈，从系统（CUDA/驱动/OS）、模型（注意力冗余、激活函数、权重稀疏）、数据（加载、分词、格式）三维度拆解，并提供量化评估方法与场景化优化方案（个人开发/企业推理/边缘部署），助力榨干硬件潜力。

# 大模型服务平台百炼 # 并行计算 # 监控 # PyTorch # 算法框架/工具 # 异构计算

LDG_AGI

|

博文

【AI大模型】Transformers大模型库（一）：Tokenizer

# 自然语言处理 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

InspireMusic：阿里通义实验室开源的音乐生成模型，支持文本或音频生成多种风格的音乐

阿里通义实验室开源的音乐生成技术，支持通过简单描述快速生成多种风格的高质量音乐作品。

# 图像识别 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具 # 开发者

Deephub

|

5月前

|

博文

PyTorch 分布式训练底层原理与 DDP 实战指南

深度学习模型规模激增，如Llama 3.1达4050亿参数，单卡训练需数百年。并行计算通过多GPU协同解决此问题。本文详解PyTorch的分布式数据并行（DDP），涵盖原理、通信机制与代码实战，助你高效实现多卡训练。

# 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

Echo_Wish

|

1月前

|

博文

|

来自：弹性计算

你的模型真的“懂”吗？用 Captum / SHAP 把神经网络扒开给你看

# 机器学习/深度学习 # 自然语言处理 # 搜索推荐 # PyTorch # 算法框架/工具

ModelScope运营小助手

|

博文

|

来自： ModelScope模型即服务

社区供稿 | 本地部署通义千问大模型做RAG验证

这篇文章中，我们通过将模搭社区开源的大模型部署到本地，并实现简单的对话和RAG。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 并行计算 # PyTorch # 算法框架/工具 # 开发工具 # Python

度假的小鱼

|

博文

【传知代码】Modnet 人像抠图-论文复现

MODNet是一种轻量级、实时的无trimap人像抠图模型，强调高效和鲁棒性。它由语义预测、细节预测和语义-细节混合三个模块构成，通过自监督学习策略SOC保持模块间一致性。MODNet在人像抠图任务中表现出色，适用于多种场景，如展馆互动、商场引流、图像编辑、广告制作等。论文和源码可在给定链接中获取，项目还提供了WebUI方便用户直接使用。

# 机器学习/深度学习 # 人工智能 # PyTorch # 调度 # SoC

BetterBench

|

博文

Dropout和R-Dropout的使用技巧

【8月更文挑战第4天】Dropout及其扩展R-Dropout在机器学习中的应用，包括Dropout解决过拟合问题的方法、最佳实践技巧以及R-Dropout如何通过两次前向传播和损失函数正则化来提高模型的泛化能力。

# 机器学习/深度学习 # 自然语言处理 # PyTorch # API # 算法框架/工具

LDG_AGI

|

博文

【AI大模型】Transformers大模型库（五）：AutoModel、Model Head及查看模型结构

# 存储 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch