官方博客-第24页-阿里云开发者社区

阿里云云原生

2025-06-30

405

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

405

寒亭

2023-09-18

47913

一次访问Redis延时高问题排查与总结（2）

本文是一次访问Redis延时高问题排查与总结的续篇，主要讲述了当时没有发现的一些问题和解决方案。

寒亭

47,913

雅纯

2024-05-15

121882

云效AppStack+阿里云MSE实现应用服务全链路灰度

在应用开发测试验证通过后、进行生产发布前，为了降低新版本发布带来的风险，期望能够先部署到灰度环境，用小部分业务流量进行全链路灰度验证，验证通过后再全量发布生产。本文主要介绍如何通过阿里云MSE 微服务引擎和云效应用交付平台AppStack 实现灰度发布。

雅纯

121,882

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

陈浩章颖强

2024-05-29

55697

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,697

阿里云瑶池数据库

2024-08-13

748

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AnalyticDB Spark如何通过向量化引擎提升性能？

阿里云瑶池数据库

748

赵世振

2024-08-21

1443

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,443

舟谨

2024-12-13

443

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

443

探索云世界

2024-12-20

387

体验云数据库RDS通用云盘核心能力

本次课程由杨浩磊（木信）分享，主题为体验云数据库RDS通用云盘的核心能力。内容分为四部分：1) 初识RDS通用云盘，介绍其低成本、高性能的特点；2) 核心能力详解，涵盖IO加速、IO突发和数据归档功能；3) 方案及应用案例，展示实际性能提升与成本优化；4) 线上活动与权益，提供免费试用等优惠。RDS通用云盘通过多级存储架构，显著提升读写性能并降低存储成本，适用于多种业务场景。

探索云世界

387

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

一次访问Redis延时高问题排查与总结（2）

云效AppStack+阿里云MSE实现应用服务全链路灰度

vLLM部署Yuan2.0：高吞吐、更便捷

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

如何提取手写票据信息

体验云数据库RDS通用云盘核心能力

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

一次访问Redis延时高问题排查与总结（2）

云效AppStack+阿里云MSE实现应用服务全链路灰度

vLLM部署Yuan2.0：高吞吐、更便捷

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

如何提取手写票据信息

体验云数据库RDS通用云盘核心能力