官方博客-第18页-阿里云开发者社区

阿里云云原生

2025-06-30

443

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

443

赫曦

2024-05-15

93222

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,222

缘祺

2024-05-15

112876

浅析MySQL代价估计器

代价估计是优化其中非常重要的一个步骤，研究代价估计的原理和MySQL的具体实现对做SQL优化是非常有帮助。本文有案例有代码，由浅入深的介绍了代价估计的原理和MySQL的具体实现。

缘祺

112,876

ModelScope

2024-05-15

1894

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,894

ModelScope

2024-05-15

1182

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,182

言澈

2024-05-15

1395

全景剖析阿里云容器网络数据链路（一）—— Flannel

本文是[全景剖析容器网络数据链路]第一部分，主要介绍Kubernetes Flannel模式下，数据面链路的转转发链路

言澈

1,395

阿里云瑶池数据库

2024-05-15

71412

数据存储成本飙升，莫慌，RDS数据归档功能来了

一文解锁阿里云RDS数据归档功能。

阿里云瑶池数据库

71,412

阿里云存储

2024-10-15

1316

AI时代数据湖实践

本文分享了如何利用阿里云的存储解决方案构建一个具备高效处理、高时效性的AI数据湖，通过高吞吐训练和高效推理帮助企业快速实现数据价值，以及用户在使用中的最佳实践。

阿里云存储

1,316

龙蜥社区OpenAnolis

2024-11-06

775

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

775

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

浅析MySQL代价估计器

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

全景剖析阿里云容器网络数据链路（一）—— Flannel

数据存储成本飙升，莫慌，RDS数据归档功能来了

AI时代数据湖实践

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

浅析MySQL代价估计器

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

全景剖析阿里云容器网络数据链路（一）—— Flannel

数据存储成本飙升，莫慌，RDS数据归档功能来了

AI时代数据湖实践

云+AI时代下，Alibaba Cloud Linux 进一步演进思考