官方博客-第3页-阿里云开发者社区

  • 2025-03-21
    1131

    监控vLLM等大模型推理性能

    本文将深入探讨 AI 推理应用的可观测方案,并基于 Prometheus 规范提供一套完整的指标观测方案,帮助开发者构建稳定、高效的推理应用。

    1,131
  • 实时数仓Hologres OLAP场景核心能力介绍

    Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎,解决复杂OLAP难题。

  • 2025-01-17
    674

    链路诊断最佳实践:1 分钟定位错慢根因

    本文聚焦于线上应用的风险管理,特别是针对“错”(程序运行不符合预期)和“慢”(性能低下或响应迟缓)两大类问题,提出了一个系统化的根因诊断方案。

    674
  • 2024-09-06
    1458

    API 网关 OpenID Connect 实战:单点登录(SSO)如此简单

    单点登录(SSO)可解决用户在多系统间频繁登录的问题,OIDC 因其标准化、简单易用及安全性等优势成为实现 SSO 的优选方案,本文通过具体步骤示例对 Higress 中开源的 OIDC Wasm 插件进行了介绍,帮助用户零代码实现 SSO 单点登录。

  • 2024-09-23
    1113

    重磅!阿里云可观测产品家族全新升级,AI +数据双驱动,打造全栈可观测体系

    近日,阿里云可观测产品家族正式发布云监控 2.0,隶属产品日志服务 SLS、云监控 CMS、应用实时监控服务 ARMS 迎来重磅升级。

  • 2025-01-26
    1244

    最近谈论 SSE 和 WebSocket 的人越来越多的原因

    实时通信已经成了大模型应用的标配。

  • 2023-02-22
    23158

    Flink CDC+Kafka 加速业务实时化

    阿里巴巴开发工程师,Apache Flink Committer 任庆盛,在 9 月 24 日 Apache Flink Meetup 的分享。

    23,158
  • 2024-05-15
    93559

    当 OpenTelemetry 遇上阿里云 Prometheus

    本文以构建系统可观测为切入点,对比 OpenTelemetry 与 Prometheus 的相同与差异,重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

  • 2024-05-15
    63332

    All in One:Prometheus 多实例数据统一管理最佳实践

    当管理多个Prometheus实例时,阿里云Prometheus托管版相比社区版提供了更可靠的数据采集和便捷的管理。本文比较了全局聚合实例与数据投递方案,两者在不同场景下各有优劣。

  • 1
    2
    3
    4
    ...
    25
    到第
    3/25