《阿里云可观测最佳实践》——阿里云可观测解决方案介绍

简介: 《阿里云可观测最佳实践》——阿里云可观测解决方案介绍

阿里云可观测解决方案介绍


阿里云可观测套件(Alibaba Cloud Observability Suite,ACOS)围绕Prometheus服务、Grafana服务和链路追踪服务, 形成指标存储分析、链路存储分析、异构构数据源集成的可观测数据层,同时通过标准的PromQL和SQL,提供数据大盘展示,告警和数据探索能力。为IT成本管理、企业风险治理、智能运维、业务连续性保障等不同场景赋予数据价值,让可观测数据真正做到不止于观测。

image.png

与众多第三方服务或开源自建方案不同,阿里云可观测套件实现多层次连接,全面打破数据孤岛,挖掘数据背后的业务价值。


l 向上形成兼容开源标准的统一观测界面

与应用实时监控服务ARMS的应用层监控(APM)、前端体验监控(RUM)、基于eBPF技术的K8s监控、云监控等阿里云自研可观测产品双向连接,将可观测数据与分析能力以开放标准(PromQL)、统一开放界面(Grafana)的形式提供给用户,便于用户的再集成与二次加工。ARMS也全面支持OpenTelemetry SDK进行自定义埋点的增强。


l 向下连接阿里云可观测数据存储类产品

统一诸如日志服务SLS、Elasticsearch服务等可观测数据存储,以及散落在异构数据存储设施中(如Clickhouse、Lindorm、RDS)的可观测数据,实现可观测数据源管理与异构数据间无缝探索。


l3横向连接阿里云所有应用管控产品与中间件产品

阿里云所有应用管控(EDAS、SAE、ACK、FC等)与中间件产品全面拥抱开源可观测标准,并与可观测套件进行连接。目前,已有超过50款阿里云云服务通过Prometheus标准进行观测。

相关文章
|
10月前
|
存储 人工智能 运维
阿里云联合信通院发布《面向LLM应用的可观测性能力要求》
随着大模型技术的广泛应用,大语言模型(LLM)在对话系统、检索增强生成(RAG)、智能体(Agent)等场景中展现出无限的想象力与创造力。同时,基于 LLM 以及 AI 生态技术栈构建的应用以及业务场景也如雨后春笋般不断涌现。然而,LLM 应用在生产落地过程中面临着模型不确定性大、架构链路复杂、用户体验难以评估等诸多痛点。如何构建 LLM 应用的全链路可观测性体系以及如何评估可观测性能力是否完善,业界缺乏统一且完整细致的标准。
|
存储 Kubernetes 数据可视化
|
2月前
|
存储 人工智能 前端开发
使用Spring AI Alibaba构建智能体Agent
本文详解使用Spring AI Alibaba框架,结合DashScope和React Agent,通过两个实战案例(基础测试+生产级应用),教你快速构建Java AI智能体
1345 7
|
存储 人工智能 运维
重磅!阿里云可观测产品家族全新升级,AI +数据双驱动,打造全栈可观测体系
近日,阿里云可观测产品家族正式发布云监控 2.0,隶属产品日志服务 SLS、云监控 CMS、应用实时监控服务 ARMS 迎来重磅升级。
1634 110
|
人工智能 运维 监控
首个云上 AI 原生全栈可观测平台来了!
9月21日,2024 云栖大会,阿里云发布全新的 AI 原生全栈可观测平台,首次实现云上 AI 大模型从训练到推理再到应用的全链路实时观测、告警与诊断。
1521 103
|
人工智能 监控 开发者
详解大模型应用可观测全链路
阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。
2741 157
详解大模型应用可观测全链路
|
10月前
|
SQL 人工智能 数据挖掘
阿里云可观测 2025 年 6 月产品动态
阿里云可观测 2025 年 6 月产品动态
|
存储 人工智能 Prometheus
剑指大规模 AI 可观测,阿里云 Prometheus 2.0 应运而生
本文介绍了阿里云Prometheus 2.0方案,针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集,采用全新时序存储引擎提升性能,并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力,结合PromQL与SPL语言增强分析功能。此外,该方案已成功应用于阿里云内部AI系统,如百炼、通义千问等大模型全链路监控。未来,阿里云将发布云监控2.0产品,进一步完善智能观测技术栈。
1266 42
|
存储 人工智能 运维
云监控 2.0:全栈智能可观测平台
云监控2.0是由阿里云智能集团资深产品专家司徒放分享的全栈智能可观测平台。该平台旨在解决传统监控系统的割裂问题,通过统一接入、存储和观测模型,实现基础设施、应用及用户体验的全面可观测。云监控2.0引入了智能体和大模型技术,支持全局搜索、问题排查和根因定位,大幅提升运维效率。未来将扩展更多智能洞察场景,并开放API供客户定制使用。
854 7
|
人工智能 监控 数据库
LLM 应用可观测性:从 Trace 视角展开的探索与实践之旅
基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点,本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战,近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践,一起来了解下吧。
20823 142
LLM 应用可观测性:从 Trace 视角展开的探索与实践之旅