官方博客-第20页-阿里云开发者社区

望雲十雨言澈

2025-04-10

585

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

585

阿里云云原生

2025-06-30

443

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

443

弃余

2023-08-11

1559

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

1,559

阿里云存储

2024-05-15

95395

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

95,395

阿里云存储

2024-10-15

1319

AI时代数据湖实践

本文分享了如何利用阿里云的存储解决方案构建一个具备高效处理、高时效性的AI数据湖，通过高吞吐训练和高效推理帮助企业快速实现数据价值，以及用户在使用中的最佳实践。

阿里云存储

1,319

探索云世界

2024-12-20

880

本文介绍了对象存储（OSS）在AI业务中的应用与实践。内容涵盖四个方面：1) 对象存储作为AI数据基石，因其低成本和高弹性成为云上数据存储首选；2) AI场景下的对象存储实践方案，包括数据获取、预处理、训练及推理阶段的具体使用方法；3) 国内主要区域的默认吞吐量提升至100Gbps，优化了大数据量下的带宽需求；4) 常用工具介绍，如OSSutil、ossfs、Python SDK等，帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施，以及不同工具的特点和应用场景。

探索云世界

880

探索云世界

2025-01-02

415

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

415

阿里云云原生

2025-01-24

821

智能理解 PPT 内容，快速生成讲解视频

本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容，快速生成相匹配的解说词；文本模型对解说词进行优化，提高其可读性和吸引力；语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成，只需一键操作，系统即可自动整合图片、文本和音频素材，快速生成对应讲解视频。

阿里云云原生

821

望宸

2025-02-20

684

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

684

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Linux 内存管理新特性：Memory folios 解读

AIGC训练场景下的存储特征研究

AI时代数据湖实践

AI场景下的对象存储OSS数据管理实践

云端问道11期实践教学-创建专属AI助手

智能理解 PPT 内容，快速生成讲解视频

大模型推理服务全景图

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Linux 内存管理新特性：Memory folios 解读

AIGC训练场景下的存储特征研究

AI时代数据湖实践

AI场景下的对象存储OSS数据管理实践

云端问道11期实践教学-创建专属AI助手

智能理解 PPT 内容，快速生成讲解视频

大模型推理服务全景图