官方博客-第23页-阿里云开发者社区

阿里云云原生

2025-06-30

444

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

444

阿里云云原生

2025-08-18

518

基于 EventBridge 构筑 AI 领域高效数据集成方案

本文深入探讨了AI时代数据处理的变革与挑战，分析了事件驱动架构（EventBridge）在AI数据处理中的技术优势，并结合实践案例，展示了其在多源数据接入、向量数据库优化、智能数据转换等方面的应用价值。

阿里云云原生

518

韩述

2023-09-13

2635

AnalyticDB PostgreSQL构建一站式实时数仓实践

本文介绍通过 AnalyticDB PostgreSQL 版基于实时物化视图，构建流批一体的一站式实时数仓解决方案，实现一套系统、一份数据、一次写入，即可在数仓内完成实时数据源头导入到实时分析全流程。

韩述

2,635

桦雄

2024-05-15

133483

走进RDS之MySQL内存分配与管理（上）

MySQL的内存分配、使用、管理的模块较多，本篇文章主要介绍InnoDB层和SQL层内存分配管理器，主要包括ut_allocator、mem_heap_allocator和MEM_ROOT，代码版本主要基于8.0.25。

桦雄

133,483

ModelScope

2024-05-15

1241

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,241

ModelScope

2024-05-15

769

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

769

阿里云云原生

2024-09-02

702

西游再现，一键部署 Flux 文生图大模型生成西游人物

从花果山的灵石出世，到取经路上的九九八十一难，再到大闹天宫的惊心动魄……这些耳熟能详的西游场景，如今都能通过 Flux 模型，以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的 flux.1-dev-fp8 大模型，搭配 Lora 模型，无需复杂的配置，一键部署，你就能成为这场视觉盛宴的创造者。

阿里云云原生

702

片风

2025-01-14

538

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

政采云基础架构团队技术专家朱海峰介绍了业务网关项目的背景和解决方案。

片风

538

望雲十雨言澈

2025-04-10

585

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

585

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

基于 EventBridge 构筑 AI 领域高效数据集成方案

AnalyticDB PostgreSQL构建一站式实时数仓实践

走进RDS之MySQL内存分配与管理（上）

元象大模型开源30款量化版本加速低成本部署丨附教程

联合XTuner，魔搭社区全面支持数据集的长文本训练

西游再现，一键部署 Flux 文生图大模型生成西游人物

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

AI Infra之模型显存管理分析

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

基于 EventBridge 构筑 AI 领域高效数据集成方案

AnalyticDB PostgreSQL构建一站式实时数仓实践

走进RDS之MySQL内存分配与管理（上）

元象大模型开源30款量化版本 加速低成本部署丨附教程

联合XTuner，魔搭社区全面支持数据集的长文本训练

西游再现，一键部署 Flux 文生图大模型生成西游人物

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

AI Infra之模型显存管理分析

元象大模型开源30款量化版本加速低成本部署丨附教程