官方博客-第21页-阿里云开发者社区

阿里云云原生

2025-06-30

425

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

425

豁朗

2022-05-16

2225

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

2,225

德歌

2023-09-14

25860

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

本文将带领大家来体验一下如何将“千问大模型+文本向量化模型”植入到PG|PolarDB中, 让数据库具备AI能力.

德歌

25,860

王明橙鲤黄俊

2024-05-15

64124

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,124

ModelScope

2024-05-15

943

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

943

隆基

2024-05-15

108469

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

从整体技术架构上学习 RocketMQ 5.0 的云原生架构、一体化架构，最后再分别从业务场景切入，详细介绍 RocketMQ 5.0 在不同的业务场景提供的能力和关键技术原理，包括业务消息、流处理、物联网以及面向云时代的事件驱动场景。

隆基

108,469

阿里云云原生

2024-05-15

153777

Higress 基于自定义插件访问 Redis

本文介绍了Higress，一个支持基于WebAssembly (WASM) 的边缘计算网关，它允许用户使用Go、C++或Rust编写插件来扩展其功能。文章特别讨论了如何利用Redis插件实现限流、缓存和会话管理等高级功能。

阿里云云原生

153,777

ModelScope

2024-05-15

1148

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,148

阿里云瑶池数据库

2024-05-15

71390

数据存储成本飙升，莫慌，RDS数据归档功能来了

一文解锁阿里云RDS数据归档功能。

阿里云瑶池数据库

71,390

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

通义千问开源模型在PAI灵骏的最佳实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

Higress 基于自定义插件访问 Redis

vLLM部署Yuan2.0：高吞吐、更便捷

数据存储成本飙升，莫慌，RDS数据归档功能来了

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

通义千问开源模型在PAI灵骏的最佳实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

Higress 基于自定义插件访问 Redis

vLLM部署Yuan2.0：高吞吐、更便捷

数据存储成本飙升，莫慌，RDS数据归档功能来了