官方博客-第3页-阿里云开发者社区

悦达

2025-03-21

1229

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,229

刘佳旭

2023-09-26

139069

云原生场景下高可用架构的最佳实践

刘佳旭

139,069

望宸

2025-02-07

872

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

872

阿里云云原生

2024-07-01

33187

详解微服务应用灰度发布最佳实践

相对于传统软件研发，微服务架构下典型的需求交付最大的区别在于有了能够小范围真实验证的机制，且交付单位较小，风险可控，灰度发布可以弥补线下测试的不足。本文从 DevOps 视角概述灰度发布实践，介绍如何将灰度发布与 DevOps 工作融合，快来了解吧~

阿里云云原生

33,187

隆基

2024-05-15

142883

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

142,883

雅纯

2024-05-15

103676

一文搞懂需求流程规范的制定方法和落地技巧

随着业务和产品的发展、团队的不断扩大，很多团队都不可避免的会遇到需求流程混乱的问题。虽然有的团队也编写了一些“需求流程规范”的文档，但最终却流于纸面，难以在团队真正落地。如何科学制定并有效落实需求管理规范呢？对此，云效产品经理陈逊进行了非常详细的直播分享，本文是他经验的文字总结。

雅纯

103,676

子白

2024-05-15

102502

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,502

阿里云中间件

2024-07-23

15692

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

大语言模型的革命性突破使智能编程成为了可能，通义灵码正是基于通义大模型打造的 AI 编程助手，通过 IDE 插件的形式提供代码补全、单元测试生成等功能，能达到毫秒级的响应速度。目前，通义灵码已在阿里云内部及多家企业中应用，阿里云也在探索多智能体产品，即 AI 程序员，助力数字世界的蓬勃发展，颠覆 IT 生产力。

阿里云中间件

15,692

阿里云云原生

2025-09-29

504

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

本文将分享我们在构建 SLS SQL Copilot 过程中的工程实践，展示如何基于阿里云 SLS 打造一套完整的 LLM 应用数据基础设施。

阿里云云原生

504

官方博客-第3页-阿里云开发者社区

类目筛选

内容类型

监控vLLM等大模型推理性能

云原生场景下高可用架构的最佳实践

浏览量超 10w 的热图，描述 RAG 的主流架构

详解微服务应用灰度发布最佳实践

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

一文搞懂需求流程规范的制定方法和落地技巧

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

官方博客-第3页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

监控vLLM等大模型推理性能

云原生场景下高可用架构的最佳实践

浏览量超 10w 的热图，描述 RAG 的主流架构

详解微服务应用灰度发布最佳实践

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

一文搞懂需求流程规范的制定方法和落地技巧

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施