官方博客-第5页-阿里云开发者社区

寒斜

2024-11-19

756

基于事件驱动构建 AI 原生应用

AI 应用在商业化服务的阶段会面临诸多挑战，比如更快的服务交付速度，更实时、精准的结果以及更人性化的体验等，传统架构限制于同步交互，无法满足上述需求，本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

寒斜

756

悦达

2025-03-21

1138

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,138

阿里云云原生

2025-04-29

676

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

本文介绍了阿里云Prometheus 2.0方案，针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集，采用全新时序存储引擎提升性能，并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力，结合PromQL与SPL语言增强分析功能。此外，该方案已成功应用于阿里云内部AI系统，如百炼、通义千问等大模型全链路监控。未来，阿里云将发布云监控2.0产品，进一步完善智能观测技术栈。

阿里云云原生

676

阿里云云原生

2024-05-15

93568

当 OpenTelemetry 遇上阿里云 Prometheus

本文以构建系统可观测为切入点，对比 OpenTelemetry 与 Prometheus 的相同与差异，重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

阿里云云原生

93,568

澄潭钰诚

2024-07-19

21943

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

Higress 最新的 1.4 版本基于为通义千问，以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀，开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。

澄潭钰诚

21,943

阿里云云原生

2024-09-25

771

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

771

信徒

2024-12-05

829

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

本文详细记录了作者在处理HSF调用异常问题的过程中，从初步怀疑死锁到最终发现并解决活锁问题的全过程。

信徒

829

阿里云云原生

2024-05-15

2475

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,475

茏城

2024-06-28

1498

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

1,498

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

基于事件驱动构建 AI 原生应用

监控vLLM等大模型推理性能

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

当 OpenTelemetry 遇上阿里云 Prometheus

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

新场景、新能力，AI-native 时代的可观测革新

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

深度｜大模型时代下，基于湖仓一体的数据智能新范式

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于事件驱动构建 AI 原生应用

监控vLLM等大模型推理性能

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

当 OpenTelemetry 遇上阿里云 Prometheus

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

新场景、新能力，AI-native 时代的可观测革新

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

深度｜大模型时代下，基于湖仓一体的数据智能新范式