接上篇:
https://developer.aliyun.com/article/1222959?spm=a2c6h.13148508.setting.19.4f394f0em1x0Jq
上图显示集群级别有两个Pod不是ready状态。通过对phase进行排序快速获取两个处于pending状态的Pod。也可以看到有15个Pod在过去24小时存在重启行为,进行排序后即可快速找到这些Pod。
可以点击具体节点,查看其CPU请求率的top10,点击查看详情后可在系统资源里进行查看,以判断请求量是否合理,并进行修正。
由此可见,Grafana大盘具备很强的交互能力和逻辑。
前端应用的每一个deployment 或资源详情页也具备排查逻辑。概览中展示了管控层、CPU、网络、内存等情况,一眼便能知晓系统是否存在问题,可以快速查看问题所在。
与此同时,大盘还集成了日志以及7层的应用性。
以上能力全部是基于eBPF的无侵入性提供的开箱即用的能力。
阿里云可观测团队构建了kubernetes统一监控,无侵入式地提供多语言、应用性能黄金指标,支持多种协议,结合kubernetes管控层与网络系统层监控,提供全栈一体式的可观测体验。通过流量拓扑、链路、资源的关系,可进行关联分析,进一步提升在kubernetes环境下排查问题的效率。
未来,阿里云可观测团队将进一步挖掘eBPF全覆盖、无侵入、可编程的特性,在以下三个方面持续发力:
第一, 可扩展APM,简称eAPM。围绕APM不断扩展边界,解决其侵入每种语言都需要单独埋点的问题,解决在应用层面看不到的底层黑盒问题,包括以下几个方面:
• 无侵入式的多语言性能监控;
• 无侵入式的分布式链路追踪;
• 应用请求粒度的系统与网络分析。
第二, 提供工具,针对包括tracing、profiling、动态网络包跟踪以及内核事件在用户态进行处理的开发框架进行优化。
第三, 实现eBPF增强的内置指标、链路和日志,主要包括对应用协议更多的支持以及高阶的系统指标和网络指标。