官方博客-第2页-阿里云开发者社区

阿里云云原生

2024-05-15

93671

当 OpenTelemetry 遇上阿里云 Prometheus

本文以构建系统可观测为切入点，对比 OpenTelemetry 与 Prometheus 的相同与差异，重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

阿里云云原生

93,671

阿里云云原生

2024-05-15

2569

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,569

白玙

2025-03-14

1830

详解大模型应用可观测全链路

阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。

白玙

1,830

悦达

2025-03-21

1226

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,226

柳遵飞

2024-12-11

1023

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

1,023

刘佳旭

2023-09-26

139065

云原生场景下高可用架构的最佳实践

刘佳旭

139,065

子白

2024-05-15

102501

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,501

隆基

2024-05-15

142880

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

142,880

乐忱

2024-06-14

39965

AI时代：云存储加速多模态数据存储与管理创新

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

39,965

官方博客-第2页-阿里云开发者社区

类目筛选

内容类型

当 OpenTelemetry 遇上阿里云 Prometheus

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

详解大模型应用可观测全链路

监控vLLM等大模型推理性能

SpringCloud 应用 Nacos 配置中心注解

云原生场景下高可用架构的最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

AI时代：云存储加速多模态数据存储与管理创新

官方博客-第2页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

当 OpenTelemetry 遇上阿里云 Prometheus

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

详解大模型应用可观测全链路

监控vLLM等大模型推理性能

SpringCloud 应用 Nacos 配置中心注解

云原生场景下高可用架构的最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

AI时代：云存储加速多模态数据存储与管理创新