开发者社区 > 云原生 > 云原生可观测 > 正文

假设接到接口耗时长的报警,需要如何操作?

已解决

假设接到接口耗时长的报警,需要如何操作?

展开
收起
游客lmkkns5ck6auu 2022-08-24 11:10:20 327 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    假设接到接口耗时长的报警,需要检查哪些接口慢以及它们为什么慢,首先需要检 查慢接口的分布,选择最近一小时,按接口聚合,结果如上图。图中不同颜色代表不同接口,可以发现调用耗时大于 3 秒钟的集中在两个接口上,非常直观。然后排查接口慢的原因,查看具体调用链路,点击 plan 可以看到更多详情信息,比如指标、日志等。无论是从外面进入详情,还是在里面查看详情,详情页面都是点 击后从右侧推出,在查看详情的交互上保持一致,操作流畅。然后找到最慢的一条查看线程剖析,定位到行级代码,最终发现根因,解决问题。整个排查过程的体验非常顺畅,因为对信息的分层合理,方便聚焦,探索路径和引导方式也符合认知,清晰易操作。

    以上内容摘自 《2021 阿里云可观测技术峰会演讲实录合辑(上)》 电子书,点击https://developer.aliyun.com/ebook/download/7805 可下载完整版

    2022-08-24 16:13:28
    赞同 展开评论 打赏

云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载