异构计算的搜索结果_第14页-阿里云开发者社区

aliyun9170107523-43660

|

1月前

|

博文

|

在2025年，大规模语言模型（LLM）的训练已经进入到超大规模时代，模型参数量达到数千亿甚至万亿级别，训练过程需要动用数百甚至数千个GPU/TPU。在这种情况下，高效的集群管理系统成为训练成功的关键基础设施。Slurm（Simple Linux Utility for Resource Management）作为目前最流行的开源作业调度系统，广泛应用于科研机构和大型科技公司的超级计算集群中。

# 监控 # Cloud Native # 网络性能优化 # 调度 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

120_检查点管理：故障恢复 - 实现分布式保存机制

在大型语言模型（LLM）的训练过程中，检查点管理是确保训练稳定性和可靠性的关键环节。2025年，随着模型规模的不断扩大，从百亿参数到千亿参数，训练时间通常长达数周甚至数月，硬件故障、软件错误或网络中断等问题随时可能发生。有效的检查点管理机制不仅能够在故障发生时快速恢复训练，还能优化存储使用、提高训练效率，并支持实验管理和模型版本控制。

# 存储 # 运维 # 监控 # 数据安全/隐私保护 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

125_训练加速：FlashAttention集成 - 推导注意力优化的独特内存节省

2025年，大型语言模型的训练面临着前所未有的挑战。随着模型参数量和序列长度的不断增加，传统注意力机制的内存瓶颈问题日益突出。FlashAttention作为一种突破性的注意力算法，通过创新的内存访问模式和计算优化，显著提升了训练效率和内存利用。

# 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

124_数据并行扩展：Megatron框架 - 分析模型分片的独特通信开销

2025年，大型语言模型的规模已达到数千亿甚至数万亿参数，单GPU训练已成为不可能的任务。高效的分布式训练技术成为训练超大模型的关键。Megatron框架作为业界领先的分布式训练解决方案，通过创新性的并行策略，实现了对超大语言模型的高效训练。

# 机器学习/深度学习 # 人工智能 # 并行计算 # 算法 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

130_知识蒸馏技术：温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

随着大型语言模型（LLM）的规模不断增长，部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例，其671B参数的规模即使经过INT4量化后，仍需要至少6张高端GPU才能运行，这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术，通过将大型教师模型的知识迁移到小型学生模型中，在显著降低模型复杂度的同时保留核心性能，成为解决这一问题的关键技术之一。

# 边缘计算 # 人工智能 # PyTorch # 算法框架/工具 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

17_文本预处理全流程：分词到lemmatization

在自然语言处理（NLP）领域，文本预处理是整个流程中最基础、也最关键的一步。2025年的研究表明，高质量的文本预处理可以将后续模型性能提升30%-45%，这一数据较2023年的25%有了显著增长。预处理的核心目标是将原始文本转换为适合机器学习模型处理的结构化形式，同时保留关键语义信息。

# 机器学习/深度学习 # 缓存 # 自然语言处理 # 算法 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

48_动态架构模型：NAS在LLM中的应用

大型语言模型（LLM）在自然语言处理领域的突破性进展，很大程度上归功于其庞大的参数量和复杂的网络架构。然而，随着模型规模的不断增长，计算资源消耗、推理延迟和部署成本等问题日益凸显。如何在保持模型性能的同时，优化模型架构以提高效率，成为2025年大模型研究的核心方向之一。神经架构搜索（Neural Architecture Search, NAS）作为一种自动化的网络设计方法，正在为这一挑战提供创新性解决方案。本文将深入探讨NAS技术如何应用于LLM的架构优化，特别是在层数与维度调整方面的最新进展，并通过代码实现展示简单的NAS实验。

# 机器学习/深度学习 # 自然语言处理 # 算法 # 文件存储 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

45_混合专家模型：MoE架构详解

在大语言模型的发展历程中，参数规模的扩张一直被视为提升性能的主要途径。然而，随着模型参数达到数百亿甚至数千亿级别，传统的密集型模型架构面临着计算资源、训练效率和推理速度等诸多挑战。2025年，混合专家模型（Mixture of Experts，MoE）已成为突破这些限制的关键技术路径。

# 机器学习/深度学习 # 缓存 # 人工智能 # 负载均衡 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

55_大模型部署：从云端到边缘的全场景实践

随着大型语言模型(LLM)技术的飞速发展，从实验室走向产业化应用已成为必然趋势。2025年，大模型部署不再局限于传统的云端集中式架构，而是向云端-边缘协同的分布式部署模式演进。这种转变不仅解决了纯云端部署在延迟、隐私和成本方面的痛点，还为大模型在各行业的广泛应用开辟了新的可能性。本文将深入剖析大模型部署的核心技术、架构设计、工程实践及最新进展，为企业和开发者提供从云端到边缘的全场景部署指南。

# 监控 # 安全 # 数据安全/隐私保护 # 异构计算 # 容器

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

65_GPU选择：A100 vs RTX系列

在2025年的今天，大语言模型（LLM）已经成为人工智能领域的核心技术之一。从GPT-4到Llama 3.1，从专业领域应用到消费级产品，LLM正在以前所未有的速度改变着我们的工作和生活方式。然而，这些强大模型的训练和部署背后，都离不开高性能计算硬件的支持，尤其是GPU（图形处理单元）的选择，往往直接决定了项目的可行性、效率和成本。

# GPU云服务器 # 人工智能 # 自然语言处理 # 数据中心 # 异构计算 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

异构计算