官方博客-第20页-阿里云开发者社区

阿里云云原生

2025-06-30

444

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

444

阿里云云原生

408

LoongCollector：构建智能时代的数据采集新范式

本文聚焦 LoongSuite 生态核心组件 LoongCollector，深度解析 LoongCollector 在智算服务中的技术突破，涵盖多租户观测隔离、GPU 集群性能追踪及事件驱动型数据管道设计，通过零侵入采集、智能预处理与自适应扩缩容机制，构建面向云原生 AI 场景的全栈可观测性基础设施，重新定义高并发、强异构环境下的可观测性能力边界。

阿里云云原生

408

阿里云云原生

2025-08-18

518

基于 EventBridge 构筑 AI 领域高效数据集成方案

本文深入探讨了AI时代数据处理的变革与挑战，分析了事件驱动架构（EventBridge）在AI数据处理中的技术优势，并结合实践案例，展示了其在多源数据接入、向量数据库优化、智能数据转换等方面的应用价值。

阿里云云原生

518

韩述

2023-09-13

2635

AnalyticDB PostgreSQL构建一站式实时数仓实践

本文介绍通过 AnalyticDB PostgreSQL 版基于实时物化视图，构建流批一体的一站式实时数仓解决方案，实现一套系统、一份数据、一次写入，即可在数仓内完成实时数据源头导入到实时分析全流程。

韩述

2,635

桦雄

2024-05-15

133483

走进RDS之MySQL内存分配与管理（上）

MySQL的内存分配、使用、管理的模块较多，本篇文章主要介绍InnoDB层和SQL层内存分配管理器，主要包括ut_allocator、mem_heap_allocator和MEM_ROOT，代码版本主要基于8.0.25。

桦雄

133,483

ModelScope

2024-05-15

1241

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,241

ModelScope

2024-05-15

769

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

769

望雲十雨言澈

2025-04-10

585

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

585

闵子

2023-12-01

2906

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,906

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

LoongCollector：构建智能时代的数据采集新范式

基于 EventBridge 构筑 AI 领域高效数据集成方案

AnalyticDB PostgreSQL构建一站式实时数仓实践

走进RDS之MySQL内存分配与管理（上）

元象大模型开源30款量化版本加速低成本部署丨附教程

联合XTuner，魔搭社区全面支持数据集的长文本训练

AI Infra之模型显存管理分析

从浏览器原理出发聊聊Chrome插件

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

LoongCollector：构建智能时代的数据采集新范式

基于 EventBridge 构筑 AI 领域高效数据集成方案

AnalyticDB PostgreSQL构建一站式实时数仓实践

走进RDS之MySQL内存分配与管理（上）

元象大模型开源30款量化版本 加速低成本部署丨附教程

联合XTuner，魔搭社区全面支持数据集的长文本训练

AI Infra之模型显存管理分析

从浏览器原理出发聊聊Chrome插件

元象大模型开源30款量化版本加速低成本部署丨附教程