假设接到接口耗时长的报警,需要检查哪些接口慢以及它们为什么慢,首先需要检 查慢接口的分布,选择最近一小时,按接口聚合,结果如上图。图中不同颜色代表不同接口,可以发现调用耗时大于 3 秒钟的集中在两个接口上,非常直观。然后排查接口慢的原因,查看具体调用链路,点击 plan 可以看到更多详情信息,比如指标、日志等。无论是从外面进入详情,还是在里面查看详情,详情页面都是点 击后从右侧推出,在查看详情的交互上保持一致,操作流畅。然后找到最慢的一条查看线程剖析,定位到行级代码,最终发现根因,解决问题。整个排查过程的体验非常顺畅,因为对信息的分层合理,方便聚焦,探索路径和引导方式也符合认知,清晰易操作。
以上内容摘自 《2021 阿里云可观测技术峰会演讲实录合辑(上)》 电子书,点击https://developer.aliyun.com/ebook/download/7805 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。