开发者社区> 问答> 正文

怎么排查Tair/Redis 全链路的问题?

怎么排查Tair/Redis 全链路的问题?

展开
收起
游客4skzfvnrxrzbi 2022-01-04 16:32:09 4163 0
1 条回答
写回答
取消 提交回答
  • 全链路中每个部分都有可能会出问题,问题排查总体上包括两大部分:前段和后段。

    前段排查首先需要确定是一台客户端出问题,还是全部有问题,如果是一台出问题,大概率是客户端自己的问题。

    前段排查,包括但不限于:

    一.ECS

    1.Load,内存等;

    2.PPS 限制

    二.客户端 1.连接池满;

    2.RT 高(跨地域,gc 等);

    3.建连接慢(K8s DNS 等);

    4.大 Range 查询,发送快,接收慢

    三.网络 227

    1.网络发生丢包,抖动等;

    2.运营商网络抖动。 后段排查,主要是慢查询和 CPU排查,包括“ Proxy”、“DB”两个主要组件

    四.Proxy

    1.分发慢查询,导致 RT 升高;

    2.流量和 CPU 升高(需要扩容 proxy);

    五. DB

    1.容量、CPU 和流量问题(见前文);

    2.主机发生故障,业务侧影响和 HA 执行速度有关;

    3.慢查询,可以通过慢日志看到具体的命令后段排查,主要是慢查询和 CPU 排查,包括“ Proxy”、“DB”两个主要组件:

    一.Proxy

    1.分发慢查询,导致 RT 升高;

    2.流量和 CPU 升高(需要扩容 proxy)

    二.DB

    1.容量、CPU 和流量问题(见前文);

    2.主机发生故障,业务侧影响和 HA 执行速度有关;

    3.慢查询,可以通过慢日志看到具体的命令

    资源来源于《阿里云数据库运维实战问题改》

    https://developer.aliyun.com/topic/download?spm=a2c6h.20345107.J_6399686890.1.2e1e17dbzKUX5r&id=8198

    2022-01-04 18:02:03
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Redis集群演化的心路历程——从2.x到3.0时代 立即下载
微博的Redis定制之路 立即下载
云数据库Redis版的开源之路 立即下载