官方博客-第15页-阿里云开发者社区

阿里云云原生

2025-06-30

404

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

404

阿里云PolarDB

2023-08-22

3633

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

本文将介绍PolarDB-X对于向量化SIMD指令的探索和实践，包括基本用法及实现原理，以及在具体算子实现中的思考和沉淀。

阿里云PolarDB

3,633

子白

2024-05-15

102408

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,408

吴昆

2024-05-15

222053

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,053

ModelScope

2024-05-15

3503

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,503

ModelScope

2024-05-15

1354

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,354

ModelScope

2024-05-15

1818

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,818

剑洁雲尧

2024-09-04

591

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

591

龙蜥社区OpenAnolis

2024-11-06

2868

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

机密计算软硬结合技术保障数据安全。

龙蜥社区OpenAnolis

2,868

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

Multi-Agent实践第7期：智能体的高效协作

浅谈Elasticsearch的入门与实践

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

Multi-Agent实践第7期：智能体的高效协作

浅谈Elasticsearch的入门与实践

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读