官方博客-第20页-阿里云开发者社区

望雲十雨言澈

2025-04-10

584

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

584

弃余

2023-08-11

1558

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

1,558

杨永

2024-05-15

1506

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

1,506

ModelScope

2024-05-15

1239

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,239

ModelScope

2024-05-15

1894

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,894

ModelScope

2024-05-15

767

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

767

阿里云云原生

2024-12-17

867

10 分钟打造你的专属 AI 客服

在这个数字化时代，提供卓越的客户服务已成为企业脱颖而出的关键。为了满足这一需求，越来越多的企业开始探索人工智能（AI）助手的应用，以实现全天候（7x24）的客户咨询响应，全面提升用户体验和业务竞争力。本解决方案通过函数计算FC 和大模型服务平台百炼，为您提供一个高效便捷构建 AI 助手思路。

阿里云云原生

867

柯灵

2025-03-11

1602

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,602

丕天

2025-03-21

1174

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,174

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

Linux 内存管理新特性：Memory folios 解读

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

元象大模型开源30款量化版本加速低成本部署丨附教程

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练

10 分钟打造你的专属 AI 客服

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

Linux 内存管理新特性：Memory folios 解读

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

元象大模型开源30款量化版本 加速低成本部署丨附教程

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练

10 分钟打造你的专属 AI 客服

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

元象大模型开源30款量化版本加速低成本部署丨附教程