备案控制台

开发者社区云原生正文

集群的指标都有哪些？

集群的指标都有哪些？

展开

收起

vncamyi27xznk 2021-11-29 16:18:22 956 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客zvexcvxjsyxmm

1.第一项指标：集群健康度。目前有 Healthy/Warning/Fatal 三个值来描述，Warning 和 Fatal 对应着告警体系，比如 P2 告警发生，那集群就是 Warning；如果 P0 告警发生，那集群就是 Fatal，必须进行处理。
2.第二项指标：成功率。这里的成功率是指 Pod 的创建成功率。Pod 成功率是一个非常重要的指标，蚂蚁一周 Pod 创建量是百万级的，成功率的波动会造成大量 Pod 的失败；而且 Pod 成功率的下跌，是集群异常的最直观反应。 3.第三项指标：残留 Terminating Pod 的数量。为什么不用删除成功率呢？因为在百万级别的时候，即使 Pod 删除成功率达到 99.9%，那么 Terminating Pod 的数量也是千级别的。残留如此多的Pod，会占着应用的容量，在生产环境中是不可接受的。第四项指标：服务在线率。服务在线率是通过探针来衡量的，探针失败，意味着集群不可用。服务在线率是会对 Master 组件来设计的。
4.最后一项指标：故障机数量，这是一个节点维度的指标。故障机通常是指那些无法正确交付 Pod 的物理机，可能是磁盘满了，可能是 load 太高了。集群故障机并须做到“快速发现，快速隔离，及时修复”，毕竟故障机会对集群容量造成影响。

答复内容摘自《云原生技术与架构实践年货小红书》，这本电子书收录开发者藏经阁下载连接：https://developer.aliyun.com/topic/download?id=1127

2021-11-29 21:45:28

赞同展开评论

问答地址：

开发者社区 > 云原生 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83801

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3779

1

0

this xml file does not appear to have any style in

51925

10

0

重启Docker后报错：Error response from daemon

2332

0

0

sql server的用户名和密码怎么查啊？

37549

21

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60955

32

0

OSS的endpoint如何查看

37520

6

0

LoRa的网络覆盖能力范围是怎么样的？

3224

1

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3693

1

0

阿里云服务器如何重置系统？

24754

4

0

云原生

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践，通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式，助力制造业企业高效上云，实现系统稳定、应用敏捷智能。拥抱云原生，让创新无处不在。

我要提问

收录在圈子:

阿里云云原生

9235

+ 订阅

阿里云云原生应用平台肩负阿里巴巴集团基础设施云化以及核心技术互联网化的重要职责，致力于打造稳定、标准、先进的云原生产品，成为云原生时代的引领者，推动行业全面想云原生的技术升级，成为阿里云新增长引擎。商业化产品包括容器、云原生中间件、函数计算等。

热门讨论

热门文章

请教下 mqtt连接成功了，能收到消息，后面又自动断开了连接，是什么情况？

Nacos Namespace 未授权访问漏洞为什么？

按照函数计算FC的comfyUI部署的，comfyUI界面上没有显示Manager 按钮，是为什么？

怎么查看registry.aliyuncs.com/google_containers都有哪些镜像

请问主域名备案了，子域名还要备案吗？

nacos 客户端SDK可以灰度发布配置吗？

Nacos客户端升级后获取不到配置，这个问题怎么解决？

为什么mqtt 连接一直显示 Not authorized to connect ？用的官网示例。

在终端怎么升级python？

ots是啥我了解一下？

展开全部

Docker CE 镜像源站

微服务（Microservice）那点事

Docker的Windows容器初体验

Docker学习路线图 (持续更新中)

基于Docker容器的，Jenkins、GitLab构建持续集成CI

使用阿里云容器服务Jenkins 2.0实现持续集成之Pipeline篇(updated on 2016.12.23)

阿里中间件首席架构师钟华：《企业IT架构转型之道：阿里巴巴中台战略思想与架构实战》新书出版（含试读PDF）！

Redis Stream——作为消息队列的典型应用场景

使用Delve进行Golang代码的调试

利用Docker和阿里云容器服务轻松搭建TensorFlow Serving集群

展开全部

还有其他疑问?