官方博客-第22页-阿里云开发者社区

阿里云云原生

2025-06-30

405

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

405

佳二

2024-05-15

474

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

本篇为系列第2篇，分享在支付宝支付数据链路改造升级过程中，针对数据倾斜的优化实践新方法，在解决数据倾斜问题的同时，还能兼顾更优的计算性能！

佳二

474

资源编排ROS

2019-12-24

2171

资源编排ROS之自定制资源（多云部署Terraform篇）

资源编排服务（Resource Orchestration Service，简称ROS）是阿里云提供的一项简化云计算资源管理的服务。您可以遵循ROS定义的模板规范编写资源栈模板，在模板中定义所需的云计算资源（例如ECS实例、RDS数据库实例）、资源间的依赖关系等。

资源编排ROS

2,171

张佐玮

2023-12-01

1517

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,517

匡大虎

2024-05-15

1549

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论，深度解析企业云原生 DevSecOps 体系构建。

匡大虎

1,549

舲扬

2024-05-15

819

基于AnalyticDB PostgreSQL的实时物化视图研发实践

AnalyticDB PostgreSQL企业数据智能平台是构建数据智能的全流程平台，提供可视化实时任务开发 + 实时数据洞察，让您轻松平移离线任务，使用SQL和简单配置即可完成整个实时数仓的搭建。

舲扬

819

阿里云大数据Al技术

2024-05-15

145443

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,443

阿里云瑶池数据库

2024-05-15

125867

PolarDB闪电助攻，《香肠派对》百亿好友关系实现毫秒级查询

PolarDB分布式版助力《香肠派对》实现百亿好友关系20万QPS的毫秒级查询。

阿里云瑶池数据库

125,867

ModelScope

2024-05-15

1125

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,125

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

资源编排ROS之自定制资源（多云部署Terraform篇）

Koordinator 助力云原生应用性能提升，小红书混部技术实践

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

基于AnalyticDB PostgreSQL的实时物化视图研发实践

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

PolarDB闪电助攻，《香肠派对》百亿好友关系实现毫秒级查询

vLLM部署Yuan2.0：高吞吐、更便捷

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

资源编排ROS之自定制资源（多云部署Terraform篇）

Koordinator 助力云原生应用性能提升，小红书混部技术实践

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

基于AnalyticDB PostgreSQL的实时物化视图研发实践

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

PolarDB闪电助攻，《香肠派对》百亿好友关系实现毫秒级查询

vLLM部署Yuan2.0：高吞吐、更便捷