利用访问日志在ASM中定位异常延迟问题

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 阿里云服务网格ASM会在工作负载中注入Sidecar以实现对流量劫持,并按照用户的配置对流量进行修改、路由。因此,Sidecar处理和转发带来的额外时间开销会导致请求的延迟有一定的增长。除延迟方面的影响外,在节点性能充足的情况下,Sidecar通常不会对并发能力有显著的影响。本文将介绍利用访问日志在服务网格ASM中排查耗时异常的通用方法和思路。 一、在请求路径上确定耗时异常的组件查看访问日志中

阿里云服务网格ASM会在工作负载中注入Sidecar以实现对流量劫持,并按照用户的配置对流量进行修改、路由。因此,Sidecar处理和转发带来的额外时间开销会导致请求的延迟有一定的增长。除延迟方面的影响外,在节点性能充足的情况下,Sidecar通常不会对并发能力有显著的影响。本文将介绍利用访问日志在服务网格ASM中排查耗时异常的通用方法和思路。 

一、在请求路径上确定耗时异常的组件 查看访问日志中的duration字段确定该请求在该数据平面组件消耗的总时间(包括读取并转发请求至上游、等待上游响应,以及读取并转发上游响应至下游),如果该时间异常,则应当继续向上游方向排查调用路径上的下一个组件,如果调用路径上下一个组件的延迟正常,则可以确定耗时异常发生在当前组件上;反之则应当继续向上游排查,直至确定耗时异常的最上游组件。

二、确定耗时原因

网络传输耗时 通过观察访问日志,如果request_duration耗时长,说明当前数据面组件(Sidecar/网关)从下游读取请求消耗了较长时间;如果request_tx_duration耗时长则说明发送至上游消耗了较长时间。对于携带了Body的HTTP请求,由于Body是边读取边发送给上游(而不是读取完才发送),所以request_duration长会进一步导致request_tx_duration变长,而如果只有request_tx_duration长的情况,则说明读取请求较快,但发送给上游的速度较慢。如果response_tx_duration耗时长,则说明从上游读取response或是将response转发给下游的速度比较缓慢。

上游处理耗时 访问日志的response_duration字段可以表达从请求发生直到收到上游响应的首个字节所消耗的时间,response_duration减去request_tx_duration可以反映上游处理所消耗的时间,如果这个时间长,则说明上游处理缓慢或是上游连接网络延迟较高。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
8天前
|
JSON 缓存 fastjson
一行日志引发的系统异常
本文记录了一行日志引发的系统异常以及作者解决问题的思路。
|
17天前
|
Java 应用服务中间件 HSF
Java应用结构规范问题之AllLoggers接口获取异常日志的Logger实例的问题如何解决
Java应用结构规范问题之AllLoggers接口获取异常日志的Logger实例的问题如何解决
|
20天前
|
Ubuntu Linux 测试技术
在Linux中,已知 apache 服务的访问日志按天记录在服务器本地目录/app/logs 下,由于磁盘空间紧张现在要求只能保留最近7天的访问日志,请问如何解决?
在Linux中,已知 apache 服务的访问日志按天记录在服务器本地目录/app/logs 下,由于磁盘空间紧张现在要求只能保留最近7天的访问日志,请问如何解决?
|
20天前
|
应用服务中间件 Linux nginx
在Linux中,如何统计ip访问情况?分析 nginx 访问日志?如何找出访问页面数量在前十位的ip?
在Linux中,如何统计ip访问情况?分析 nginx 访问日志?如何找出访问页面数量在前十位的ip?
|
18天前
|
存储 大数据 索引
【Azure Contianer Apps】在云上使用容器应用时收集日志遇见延迟问题
【Azure Contianer Apps】在云上使用容器应用时收集日志遇见延迟问题
|
18天前
|
网络安全
【Azure Service Bus】启用诊断日志来获取客户端访问Azure Service Bus的IP地址 [2024-03-26 实验结果失败]
【Azure Service Bus】启用诊断日志来获取客户端访问Azure Service Bus的IP地址 [2024-03-26 实验结果失败]
|
2月前
|
存储 开发框架 前端开发
循序渐进VUE+Element 前端应用开发(31)--- 系统的日志管理,包括登录日志、接口访问日志、实体变化历史日志
循序渐进VUE+Element 前端应用开发(31)--- 系统的日志管理,包括登录日志、接口访问日志、实体变化历史日志
|
2月前
|
安全 Java API
为什么捕获异常后不要使用e.printStackTrace()打印日志
为什么捕获异常后不要使用e.printStackTrace()打印日志
|
22天前
|
监控 安全 Linux
在Linux中,如何查看和审计系统日志文件以检测异常活动?
在Linux中,如何查看和审计系统日志文件以检测异常活动?
|
2月前
|
运维
系统日志使用问题之如何防止在打印参数时遇到NPE(空指针异常)
系统日志使用问题之如何防止在打印参数时遇到NPE(空指针异常)