异构计算的搜索结果_第12页-阿里云开发者社区

aliyun9170107523-43660

|

1月前

|

博文

|

138_绿色计算：碳排放优化 - 估算部署的碳足迹与LLM环境友好型部署最佳实践

随着大语言模型(LLM)在各个行业的广泛应用，其计算需求和环境影响正日益受到关注。根据最新研究，训练一个大型LLM模型可能产生数百吨二氧化碳当量的排放，这相当于普通家庭几十年的碳足迹。在全球气候变化和可持续发展的背景下，如何优化LLM部署的碳足迹，实现环境友好型AI应用，已成为行业面临的重要挑战。

# 存储 # 人工智能 # 数据中心 # 异构计算 # Python

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

139_剪枝优化：稀疏模型压缩 - 分析结构化剪枝的独特速度提升与LLM部署加速实践

随着大语言模型(LLM)规模的不断增长，模型参数量已从最初的数亿扩展到数千亿甚至万亿级别。这种规模的模型在推理过程中面临着巨大的计算和内存挑战，即使在最先进的硬件上也难以高效部署。剪枝优化作为一种有效的模型压缩技术，通过移除冗余或不重要的参数，在保持模型性能的同时显著减少计算资源需求。

# 机器学习/深度学习 # 缓存 # 监控 # 算法 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

140_异步推理：队列管理框架 - 使用Celery处理高并发请求的独特设计

在大型语言模型(LLM)部署的实际场景中，推理服务的并发处理能力直接影响用户体验和系统稳定性。随着LLM应用的普及，如何高效处理大量并发请求成为部署优化中的关键挑战。传统的同步请求处理方式在面对突发流量时容易导致系统过载，响应延迟增加，甚至服务崩溃。异步推理通过引入队列管理机制，能够有效缓冲请求峰值，平滑系统负载，提高资源利用率，从而为LLM服务提供更稳定、更高效的并发处理能力。

# 存储 # 监控 # NoSQL # Redis # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

117_LLM训练的高效分布式策略：从数据并行到ZeRO优化

在2025年，大型语言模型（LLM）的规模已经达到了数千亿甚至数万亿参数，训练这样的庞然大物需要先进的分布式训练技术支持。本文将深入探讨LLM训练中的高效分布式策略，从基础的数据并行到最先进的ZeRO优化技术，为读者提供全面且实用的技术指南。

# 存储 # 监控 # 算法 # PyTorch # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

114_预训练：Masked LM优化与动态掩码效率深度解析

在大型语言模型（LLM）的预训练阶段，训练目标函数的设计直接影响模型的学习效率和最终性能。Masked Language Modeling（MLM）作为BERT等模型采用的核心预训练任务，通过随机掩盖文本中的部分token并让模型预测这些被掩盖的token，有效地训练了模型的双向表示能力。然而，传统的静态掩码策略存在重复率高、训练效率低等问题。动态掩码技术的引入显著提升了预训练效率和模型性能。本文将全面探讨MLM优化策略，深入推导动态掩码的效率提升原理，并介绍2025年最新的MLM优化技术，为高效预训练LLM提供理论和实践指导。

# 云解析DNS # 缓存 # 自然语言处理 # PyTorch # 算法框架/工具 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

101_参数高效微调_QLoRA技术深度解析与实践

在大型语言模型（LLM）时代，高效微调成为降低大模型应用门槛的关键技术。随着模型规模的不断扩大，传统的全参数微调方法面临着巨大的计算资源消耗和内存需求挑战。QLoRA（Quantized Low-Rank Adaptation）作为一种创新的参数高效微调技术，以其独特的量化+低秩适应双重策略，成功地在大幅降低资源消耗的同时保持了接近全精度微调的性能。本文将深入剖析QLoRA的技术原理、实现细节、性能特点，并提供丰富的实践案例，帮助读者全面掌握这一2025年仍然广泛应用的高效微调方法。

# 云解析DNS # 存储 # 机器学习/深度学习 # 数据采集 # 物联网 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

10_大模型开发环境：从零搭建你的LLM应用平台

在2025年，大语言模型(LLM)已经成为AI应用开发的核心基础设施。无论是企业级应用、科研项目还是个人创新，拥有一个高效、稳定、可扩展的LLM开发环境都至关重要。

# 监控 # 安全 # Docker # 异构计算 # 容器

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

143_成本优化：Spot实例与预留实例云资源节省计算详解与最佳实践

在云原生时代，成本优化已成为企业IT基础设施管理的核心挑战之一。随着AI和机器学习工作负载的激增，云资源成本占企业IT预算的比例持续上升，如何在保证服务质量的同时实现显著的成本节约，成为技术团队面临的紧迫问题。根据最新的Datadog云成本报告显示，截至2025年，平均有83%的容器支出被闲置资源浪费，而GPU实例支出在过去一年中增长了40%，已占计算成本的14%。在这样的背景下，深入理解和应用Spot实例和预留实例等成本优化策略，对于任何使用云服务的组织都具有重大的经济意义。

# 机器学习/深度学习 # 人工智能 # 监控 # 调度 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

136_生产监控：Prometheus集成 - 设置警报与指标选择与LLM部署监控最佳实践

在大语言模型（LLM）部署的生产环境中，有效的监控系统是确保服务稳定性、可靠性和性能的关键。随着LLM模型规模的不断扩大和应用场景的日益复杂，传统的监控手段已难以满足需求。Prometheus作为当前最流行的开源监控系统之一，凭借其强大的时序数据收集、查询和告警能力，已成为LLM部署监控的首选工具。

# 存储 # Prometheus # 监控 # Cloud Native # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

133_云端扩展：Kubernetes scaling - 设置自动缩放的阈值与LLM部署最佳实践

在大语言模型（LLM）部署的时代，如何高效地管理计算资源、应对动态负载并优化成本，成为了每个AI工程师必须面对的挑战。随着LLM应用的普及，用户请求模式变得日益复杂且难以预测，传统的静态资源配置方式已无法满足需求。Kubernetes作为云原生时代的容器编排平台，其强大的自动扩展能力为LLM部署提供了理想的解决方案。

# 容器服务Kubernetes版 # Kubernetes # Cloud Native # 异构计算 # 容器 # Perl

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

异构计算