redis瞬时查询返回量过多导致出口流量打满,影响系统整体响应时间

本文涉及的产品
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: redis瞬时查询返回量过多导致出口流量打满,影响系统整体响应时间

故障现象

问题影响现象:多个接口响应缓慢

故障处理过程

10:35告警群出现告警信息

image.png

查看一小时内的链路追踪发现支付批量更新接口调用次数较多且平均响应时间较长

image.png

image.png


10:51查看链路追踪发现org的接口响应时间较长

image.png


查看org日志发现有redis报错

image.png


查看redis监控发现10:34左右出口流量使用率达到了100%

image.png

联系运维把最大私网带宽从24M/s调到72M/s

12:00左右响应时间恢复正常


故障原因

redis瞬时查询返回量过多导致出口流量打满,影响系统整体响应时间


反思与改进方案

快速修复方案:

扩容最大私网带宽到72M/s

查找出现问题的时间段内的慢查询,目前redis主要的慢查询范围基本在org服务和condition服务,org存在慢查询的主要原因是大部分接口都是调用redis获取整个对象信息,org的请求量较高,查询量大的情况下返回的量也多,对于已发现的慢查询,目前优化了一个授权管理入口的查询接口,直接从数据库查询,返回需要的值,不走redis,该优化已发生产

整体优化方案:

org服务的高频接口都需要进行优化分析,主要从传入参数数量限制和接口处理效率优化两方面考虑,由于接口调用入口非常多,可以根据调用的频率从高到低进行优化,优先优化高频接口,主要从redis监控中的慢日志入手进行分析,找到调用的场景,定位之后进行优化,org服务计划新增一个redis,condition服务的慢查询主要集中在泰格,这部分优化可能需要爱荣分析一下

redis规范整理:

redis的使用目前比较随意,最好是要有一个规范文档,列出推荐的和不推荐的使用方法,按统一的规则进行开发,避免出现一些共性的问题,这部分计划先整理一版初稿,后期再不断完善

加强redis监控:

目前redis资源使用超过上限没有相应的告警提示,需要增加主要指标的告警,目前最重要的是出口流量使用率,一旦出现异常极易引发线上故障,需要有类似慢sql统计的机制对redis的慢日志也进行统计,对于线上出现的慢日志需要经常关注,并思考如何优化,最终目的是要消除慢日志

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
18天前
|
存储 缓存 NoSQL
深入解析Redis:一种快速、高效的键值存储系统
**Redis** 是一款高性能的键值存储系统,以其内存数据、高效数据结构、持久化机制和丰富的功能在现代应用中占有一席之地。支持字符串、哈希、列表、集合和有序集合等多种数据结构,适用于缓存、计数、分布式锁和消息队列等场景。安装Redis涉及下载、编译和配置`redis.conf`。基本操作包括键值对的设置与获取,以及哈希、列表、集合和有序集合的操作。高级特性涵盖发布/订阅、事务处理和Lua脚本。优化策略包括选择合适数据结构、配置缓存和使用Pipeline。注意安全、监控和备份策略,以确保系统稳定和数据安全。
222 1
|
1月前
|
存储 NoSQL Redis
【Redis】利用Redis List实现数据库分页快速查询
【Redis】利用Redis List实现数据库分页快速查询
111 0
|
1月前
|
存储 缓存 NoSQL
利用Redis List实现数据库分页快速查询的有效方法
利用Redis List实现数据库分页快速查询的有效方法
|
2月前
|
缓存 NoSQL 关系型数据库
亿级电商流量,高并发下Redis与MySQL的数据一致性如何保证
你们有多少人是被面试官问到过Redis和MySQL的数据一致性如何保证的? 你们是否考虑过在高并发场景下,Redis与MySQL的同步会有哪些问题?该如何解决? 本篇文章会带大家详细了解,让你知其然,知其所以然,吊打面试官。
363 0
亿级电商流量,高并发下Redis与MySQL的数据一致性如何保证
|
2月前
|
NoSQL Java Redis
面试01-Redis 如何从海量数据中查询出某一个 Key
面试01-Redis 如何从海量数据中查询出某一个 Key
95 0
|
3月前
|
缓存 NoSQL 架构师
Redis 三种批量查询技巧,高并发场景下的利器
在高并发场景下,巧妙地利用缓存批量查询技巧能够显著提高系统性能。 在笔者看来,熟练掌握细粒度的缓存使用是每位架构师必备的技能。因此,在本文中,我们将深入探讨 Redis 中批量查询的一些技巧,希望能够给你带来一些启发。
Redis 三种批量查询技巧,高并发场景下的利器
|
3月前
|
NoSQL 关系型数据库 MySQL
Redis之秒杀系统
秒杀是一种高并发场景,通常指的是在短时间内(秒级别)有大量用户同时访问某个商品或服务,争相抢购的情景。在这种情况下,系统需要处理大量并发请求,确保公平性、一致性,并防止因并发而导致的问题,例如超卖、恶意请求等。以下是在高并发秒杀场景下需要考虑的一些关键问题和解决方案:
|
1月前
|
NoSQL Java 数据库连接
使用Java实现从数据库查出数据存入Redis,并在查询时先查Redis,如果Redis中没有数据再从数据库中读取
使用Java实现从数据库查出数据存入Redis,并在查询时先查Redis,如果Redis中没有数据再从数据库中读取
356 1
|
1月前
|
NoSQL Linux Redis
Linux系统中安装redis+redis后台启动+常见相关配置
Linux系统中安装redis+redis后台启动+常见相关配置
|
8天前
|
人工智能 前端开发 Java
Java语言开发的AI智慧导诊系统源码springboot+redis 3D互联网智导诊系统源码
智慧导诊解决盲目就诊问题,减轻分诊工作压力。降低挂错号比例,优化就诊流程,有效提高线上线下医疗机构接诊效率。可通过人体画像选择症状部位,了解对应病症信息和推荐就医科室。
147 10

热门文章

最新文章