线上升级Redis纪实

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
日志服务 SLS,月写入数据量 50GB 1个月
简介: QPS相关QPS,每秒处理请求数。可以在一定程度上反映某个服务此时的压力情况。下面可以通过一个案例来分析下如何大致的估算一个服务的QPS。背景:昨天上线的一个活动,会根据唱歌时间来进行送券行为,计算下此送券行为的QPS。

hello world!

QPS相关

QPS,每秒处理请求数。可以在一定程度上反映某个服务此时的压力情况。下面可以通过一个案例来分析下如何大致的估算一个服务的QPS。

背景:昨天上线的一个活动,会根据唱歌时间来进行送券行为,计算下此送券行为的QPS。

分析:每隔送券行为都会有一条日志进行记录,如下。

2017-10-27 15:10:16 songtime=355 userid=56135899 giftid=20331 addednumbers=1

因此计算出每秒的songtime请求就可以作为目标值了。

因此可以使用如下命令:

developer@hosttx:~$ sudo devpssh -i -h /opt/iplist.all.svn 'grep songtime /home/log/baofang-yanzhishengdian.log' | grep 10-27 | cut -d " " -f 2  | uniq -c

由于访问人数比较少,所以基本上QPS为2~3。

解释:也许你会好奇,这是怎么计算出来的呢?下面来解释一下,我们的目标就是查看某一秒下有songtime日志的条数。

  • 判断一条日志中是否包含songtime ,可以使用grep命令。
  • 在线上多台GET机之间查找日志记录,可以使用sudo devpssh -i -h /opt/iplist.all.svn 'grep songtime /home/log/baofang-yanzhishengdian.log'
  • 切分出秒级日志可以使用cut命令,-d "delimiter"用于指定分隔字符, -fN用于显示哪一个field字段,默认从1开始计数。
  • uniq命令短小精悍,-c参数就是用于统计的,但是只有相邻的两行同样的日志才会被累加在第一条前面的序号上。

模拟一下Redis的同步流程

先看看目前电脑上有没有启动redis服务:

ps aux | grep redis-server

看来是没有,那么我们就可以启动几个redis-server,因为是在一台机器上,所以指定不同的端口就好了。

redis-server --port 6666

同样,使用redis-server --port 7777 再开启一个redis服务。

最后再来看下服务到底有没有启动吧。

ps aux | grep redis-server

好了,现在是两个全新的redis服务了,在开始准备具体的主从复制,同步操作前,先指定下主从关系。
- 端口为6666的作为master
- 端口为7777的作为slave

然后通过一个redis-cli的monitor命令监视下slave,看看在master中的某些key发生变化的时候,slave会做出什么样的反应。

对slave使用monitor监视

下面让7777作为6666的slave。

slaveof 127.0.0.1 6666

同时在7777server的终端下会出现其作为6666的slave的一些输出。

7777终端输出

而同时刻作为master的6666也会对7777发来的同步请求做出相应的反应。
6666终端输出

确认同步结果

模拟同步,这个时候只需要在master中随便set几个key,看看slave的monitor窗口中的输出即可。

slave实时同步master

可以看出,slave会实时将master上的数据同步过来,达到数据的一致性。这样,简单的主从同步,就算是完成了。

但是需要注意的是,作为slave的redis是不能被写入的。比如我们随便在slave上set几个key,看看能否成功,不出意外的话,你会看到如下结果。

slave状态下不能写入数据

这是因为redis的从slave-read-only默认是yes即只读状态的,所以同步完成后要修改这个变量,config set slave-read-only no就可以。

config set slave-read-only no

对slave的操作不会对master产生影响,这是必须的了。

对slave的操作不会影响master

最后同步完成之后,如果不想让7777作为6666的slave了,就可以使用slaveof no one来实现。

停止slave模式可以使用slaveof no one 来实现

线上升级redis

线上跑的redis一般为了稳定性,版本都不会很高。但是也不能太低了不是,因此有时候升级redis是很有必要的,这也是不可避免的。但是线上的redis通常会包含大量的数据,有可能多达N个多G,而且不能直接进行主从同步,这样来自slave的同步请求会挤垮来自外部的用户请求。导致服务出现报警。

通常对线上Redis做升级的话,有这样的思路: 找个替身,然后做如下步骤。

  • 让替身slave成为线上机器,同步完成后,将slave-read-only 设置为no
  • 将线上流量引入到slave上, 此时slave成为线上机器,查看线上机器的QPS,直至为0。
  • 趁此时,卸载线上的旧Redis,然后安装新版本的Redis
  • 新版本的Redis作为slave同步线上Redis的数据,同步完成后同样将slave-read-only设置为no, 然后将线上流量引回来,此时查看刚才的替身RedisQPS为0即可。

在这个过程中,查看redis请求的QPS最好的方法就是通过monitor来实现。

redis-cli -h 127.0.0.1 -p 6379 monitor | cut -d "." -f1 | uniq -c

而在升级线上Redis的时候,尤其要注意外部连接数,有时是正常的业务请求,有时是crontab统计数据跑的脚本,反正情况多样,可以通过ss -anp | grep redis:port 命令 查看连接情况。

需要注意的是要使用root权限,才能看得到具体的PID信息。

ss -anp | grep .7777

然后可以通过ps aux命令找到具体是那条命令在跑着。然后对症下药,完成整个操作。

查看具体是什么命令在连接redis


总结

回顾一下,这篇文章主要是为了谈谈对线上redis升级的体会,以及一些常识性的内容的叙述。为了循序渐进,讲了QPSRedis的主从同步的具体操作步骤,最后引出升级的步骤和过程。

其实步骤什么的不重要,重要的在于整体的思路,还有对工具的使用的熟练程度。

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
6月前
|
NoSQL Java Redis
Springboot从2.x升级到3.x以后redis默认配置调整
Springboot从2.x升级到3.x以后redis默认配置调整
417 0
|
5天前
|
缓存 NoSQL 网络协议
【Azure Redis】因为Redis升级引发了故障转移后的问题讨论
3:对于Redis的Server Load指标,每秒创建连接数的并发值,是否有建议呢? 【答】:为了避免将缓存推到 100% 服务器负载,建议将连接创建速率保持在每秒 30 个以下。
|
3月前
|
存储 缓存 NoSQL
【Azure Redis 缓存】对于Azure Redis 从 Redis 4 升级到 Redis 6 的一些疑问
【Azure Redis 缓存】对于Azure Redis 从 Redis 4 升级到 Redis 6 的一些疑问
|
3月前
|
缓存 NoSQL 网络安全
【Azure Redis 缓存 Azure Cache For Redis】Azure Redis由低级别(C)升级到高级别(P)的步骤和注意事项, 及对用户现有应用的潜在影响,是否需要停机时间窗口,以及这个时间窗口需要多少的预估问题
【Azure Redis 缓存 Azure Cache For Redis】Azure Redis由低级别(C)升级到高级别(P)的步骤和注意事项, 及对用户现有应用的潜在影响,是否需要停机时间窗口,以及这个时间窗口需要多少的预估问题
|
3月前
|
NoSQL Redis
Redis 版本升级问题之旧AOF文件如何解决
Redis 版本升级问题之旧AOF文件如何解决
|
3月前
|
NoSQL Redis
Redis 版本升级问题之识别升级过程如何解决
Redis 版本升级问题之识别升级过程如何解决
|
5月前
|
消息中间件 弹性计算 缓存
通过OOS定时升级Redis实例临时带宽
阿里云OOS提供了定时升级Redis实例临时带宽的功能,以应对数据驱动业务中的流量高峰。这个功能允许用户根据预测的业务负载,在特定日期和时间自动增加Redis实例的带宽,确保服务性能和稳定性。在高流量事件结束后,带宽会自动恢复到原设置,节省成本。 此功能适用于电商平台促销、大型游戏更新等场景,确保在流量高峰期间的系统稳定运行。
|
6月前
|
NoSQL Shell Redis
Redis热升级秘诀:保证高可用性的技术方案
Redis热升级方案允许在不中断业务的情况下,实现数千级别Redis的无缝更新。通过构建Redis Shell程序保存数据库状态,封装动态连接库,以及在运行时加载新版本库,保持客户端连接,该方法确保了业务连续性和高可用性,且升级仅需几毫秒,显著提升了系统效率。
659 6
|
存储 NoSQL Redis
Redis学习笔记:升级你的Redis服务器该怎么做(顺带也是安装)
只需下载最新版本的Redis,解压后进入目录,执行make和make install命令即可完成安装。升级Redis也同样简单,只需下载新版本的Redis,停止当前的Redis进程,替换为新版本。
273 0
|
NoSQL Redis 数据安全/隐私保护
redis集群加密码后,python的rediscluster模块升级1.3.4版本不生效
redis集群加密码后,python的rediscluster模块升级1.3.4版本不生效
redis集群加密码后,python的rediscluster模块升级1.3.4版本不生效