文档备案控制台

开发者社区云原生云原生可观测正文

监控的数据在系统分为哪几个层面？

已解决

监控的数据在系统分为哪几个层面？

展开

收起

游客lmkkns5ck6auu 2022-08-24 10:37:00 491 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客c3gxxcx6cqeyo

推荐回答

最上层为应用层，主要关心核心业务接口的健康度，通过 RED（Rate、Error、Duration）三个黄金指标进行衡量。其中 Rate 指接口的 QPS 或 TPS，Error 指错误率或错误数，Duration 指接口在多长时间内能够返回。可以通过黄金指标来定义 SLO 并分配 Error Budget。如果 Error Budget 很快耗尽，则应及时调整 SLO，直到系统优化到足够完善后，再将其调高。也可以通过 Apdex Score 衡量服务的健康度。

此外，应用层也会关心与业务强相关的指标，比如营收、用户数、UV、PV 等。中间层为中间件和存储，主要关心系统里大量应用的 Kafka client 端消费位点的提交状况、生产者缓冲区的占用率、是否会提前将缓冲区占满导致新的消息进不来、消费延迟、平均消息大小等，比如 Kafka Broker 端的水位、读写流量、磁盘使用率等，再比如云盘 ESSD 的挂载成功率、IOPS、磁盘空余空间等。最下层是基础设施层，关心的指标较为复杂，典型的有比如 ECS（K8s Node）CPU 内存水位、重启次数、定时运维事件等，比如 K8s 核心组件的 API server、ETCD、调度相关指标等，比如业务 Pod 的 Pending 状态、是否有资源可供足够的调度、OOMKilled 事件、Error 事件等，再比如VPC/SLB 相关的出口带宽、丢弃连接数等。

以上内容摘自《2021 阿里云可观测技术峰会演讲实录合辑（上）》电子书，点击https://developer.aliyun.com/ebook/download/7747 可下载完整版

2022-08-24 15:38:19

赞同展开评论

问答分类：

监控容器计算服务

问答地址：

开发者社区 > 云原生 > 云原生可观测 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

92157

49

0

this xml file does not appear to have any style in

60570

11

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

141288

16

0

#支付宝授权提示请在支付宝客户端打开链接

23891

19

0

#支付宝周期扣款无线端唤起签约页面提示“免密支付安全验证”？

8058

2

0

yyyy-MM-dd'T'HH：mm：ss.SSSZZ和yyyy-MM-dd'T'HH：mm：ss.

47751

9

0

sql server的用户名和密码怎么查啊？

41135

21

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

282741

11

0

为什么一直出现“站点创建成功”

15644

3

0

云原生

云原生可观测

云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品，形成指标、链路存储分析、异构数据源集成的数据层，通过标准PromQL和SQL提供大盘展示、告警与探索能力。

我要提问

收录在圈子:

阿里云可观测

61

+ 订阅

相关文章

提升品牌 AI 推荐率深度拆解，看懂 AI 流量底层竞争逻辑

面试被问“你的缺点是什么”，90%的应届生都答错了！（附满分话术）

【剪映小助手】添加视频接口（Add Videos）

8类工地安全防护用品检测5200张数据集分享

专访GEO落地工程师罗长才：当AI开始“抢答”，我们如何让客户重回牌桌？记者手记

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

构建视频直播系统

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

热门讨论

热门文章

请教下阿里云Grafana，这个接口/api/alerts可以用来查询告警事件吗？

ram 怎么找不到pts 的权限啊？

请问有问实现过阿里云Grafana grafana如何把当前登录人的信息传入后端嘛？

阿里云ARMS这里怎么设置ecs自定义名称的变量？

我有一些java的方法，想监控执行时间，这个我们可以对接到阿里云ARMS吗？

阿里云Grafana这个指标监控，有没有新的dashborad呀？

数据处理侧具有哪些特点？

阿里云ARMS这个问题怎么解决？

阿里云Grafana支持通过一个query同时检索多个日志吗？

ARMS关联后端trace，我希望和前端监控一样，传几个请求头给后端，请问可以配置吗？

展开全部

Istio on ACK集成生态(2): 扩展AlertManager集成钉钉助力可观测性监控能力

Litefuse 正式发布：Agent 可观测与效果评估，比 Langfuse 成本低 88%

AIOps已逝，欢迎进入AgenticOps（运维智能体）时代

Grafana Loki，轻量级日志系统

Linux调试

可观测性和传统监控的三大区别

FinOps for AI 概述

MCP Server 开发实战 | 大模型无缝对接 Grafana

可观测可回溯 | Continuous Profiling 实践解析

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

展开全部

还有其他疑问?