开发者社区 > 云原生 > 正文

一个覆盖全面的监控怎么做到从基础设施到上层应用均有对应的手段去覆盖?

一个覆盖全面的监控怎么做到从基础设施到上层应用均有对应的手段去覆盖?

展开
收起
vncamyi27xznk 2021-12-02 10:09:49 298 0
1 条回答
写回答
取消 提交回答
  • • 首先,如果故障产生时,最先感知到的其实是业务的受损,如交易量下跌、登陆的 UV 下跌等等; • 而如果继续往下钻,如果业务集群很大的时候,我们最先需要定位到某一个服务或者某一台机器,这个过 程如果没有相应的工具相佐犹如大海捞针,所以一个分布式链路级别的应用监控会是建设 Spring Cloud 应用的很好的配搭; • 等到我们找到了相应的服务要开始进行定位分析的时候,根据问题类型(是错是慢?)接下来需要开始分析 JVM、内存、CPU 等维度的指标; • 最后我们可能会发现这个问题是由于业务代码引起,也有可能由于基础设施引起,而在 K8s 中,Prometheus 目前是属于容器领域基础监控最厉害的军刀。

    答复内容摘自《云原生技术与架构实践年货小红书》,这本电子书收录开发者藏经阁 下载连接:https://developer.aliyun.com/topic/download?id=1127

    2021-12-02 11:28:43
    赞同 展开评论 打赏
问答分类:
问答地址:

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。

相关电子书

更多
容器技术在千万用户级企业的实践及网络方案优化 立即下载
静态代码扫描体系在阿里移动研发的应用 立即下载
快速变化背景下,组织如何保持过程的稳定性? 立即下载