线上升级Redis纪实-阿里云开发者社区

开发者社区> 郭璞> 正文

线上升级Redis纪实

简介: QPS相关 QPS,每秒处理请求数。可以在一定程度上反映某个服务此时的压力情况。下面可以通过一个案例来分析下如何大致的估算一个服务的QPS。 背景:昨天上线的一个活动,会根据唱歌时间来进行送券行为,计算下此送券行为的QPS。
+关注继续查看

hello world!

QPS相关

QPS,每秒处理请求数。可以在一定程度上反映某个服务此时的压力情况。下面可以通过一个案例来分析下如何大致的估算一个服务的QPS。

背景:昨天上线的一个活动,会根据唱歌时间来进行送券行为,计算下此送券行为的QPS。

分析:每隔送券行为都会有一条日志进行记录,如下。

2017-10-27 15:10:16 songtime=355 userid=56135899 giftid=20331 addednumbers=1

因此计算出每秒的songtime请求就可以作为目标值了。

因此可以使用如下命令:

developer@hosttx:~$ sudo devpssh -i -h /opt/iplist.all.svn 'grep songtime /home/log/baofang-yanzhishengdian.log' | grep 10-27 | cut -d " " -f 2  | uniq -c

由于访问人数比较少,所以基本上QPS为2~3。

解释:也许你会好奇,这是怎么计算出来的呢?下面来解释一下,我们的目标就是查看某一秒下有songtime日志的条数。

  • 判断一条日志中是否包含songtime ,可以使用grep命令。
  • 在线上多台GET机之间查找日志记录,可以使用sudo devpssh -i -h /opt/iplist.all.svn 'grep songtime /home/log/baofang-yanzhishengdian.log'
  • 切分出秒级日志可以使用cut命令,-d "delimiter"用于指定分隔字符, -fN用于显示哪一个field字段,默认从1开始计数。
  • uniq命令短小精悍,-c参数就是用于统计的,但是只有相邻的两行同样的日志才会被累加在第一条前面的序号上。

模拟一下Redis的同步流程

先看看目前电脑上有没有启动redis服务:

ps aux | grep redis-server

看来是没有,那么我们就可以启动几个redis-server,因为是在一台机器上,所以指定不同的端口就好了。

redis-server --port 6666

同样,使用redis-server --port 7777 再开启一个redis服务。

最后再来看下服务到底有没有启动吧。

ps aux | grep redis-server

好了,现在是两个全新的redis服务了,在开始准备具体的主从复制,同步操作前,先指定下主从关系。
- 端口为6666的作为master
- 端口为7777的作为slave

然后通过一个redis-cli的monitor命令监视下slave,看看在master中的某些key发生变化的时候,slave会做出什么样的反应。

对slave使用monitor监视

下面让7777作为6666的slave。

slaveof 127.0.0.1 6666

同时在7777server的终端下会出现其作为6666的slave的一些输出。

7777终端输出

而同时刻作为master的6666也会对7777发来的同步请求做出相应的反应。
6666终端输出

确认同步结果

模拟同步,这个时候只需要在master中随便set几个key,看看slave的monitor窗口中的输出即可。

slave实时同步master

可以看出,slave会实时将master上的数据同步过来,达到数据的一致性。这样,简单的主从同步,就算是完成了。

但是需要注意的是,作为slave的redis是不能被写入的。比如我们随便在slave上set几个key,看看能否成功,不出意外的话,你会看到如下结果。

slave状态下不能写入数据

这是因为redis的从slave-read-only默认是yes即只读状态的,所以同步完成后要修改这个变量,config set slave-read-only no就可以。

config set slave-read-only no

对slave的操作不会对master产生影响,这是必须的了。

对slave的操作不会影响master

最后同步完成之后,如果不想让7777作为6666的slave了,就可以使用slaveof no one来实现。

停止slave模式可以使用slaveof no one 来实现

线上升级redis

线上跑的redis一般为了稳定性,版本都不会很高。但是也不能太低了不是,因此有时候升级redis是很有必要的,这也是不可避免的。但是线上的redis通常会包含大量的数据,有可能多达N个多G,而且不能直接进行主从同步,这样来自slave的同步请求会挤垮来自外部的用户请求。导致服务出现报警。

通常对线上Redis做升级的话,有这样的思路: 找个替身,然后做如下步骤。

  • 让替身slave成为线上机器,同步完成后,将slave-read-only 设置为no
  • 将线上流量引入到slave上, 此时slave成为线上机器,查看线上机器的QPS,直至为0。
  • 趁此时,卸载线上的旧Redis,然后安装新版本的Redis
  • 新版本的Redis作为slave同步线上Redis的数据,同步完成后同样将slave-read-only设置为no, 然后将线上流量引回来,此时查看刚才的替身RedisQPS为0即可。

在这个过程中,查看redis请求的QPS最好的方法就是通过monitor来实现。

redis-cli -h 127.0.0.1 -p 6379 monitor | cut -d "." -f1 | uniq -c

而在升级线上Redis的时候,尤其要注意外部连接数,有时是正常的业务请求,有时是crontab统计数据跑的脚本,反正情况多样,可以通过ss -anp | grep redis:port 命令 查看连接情况。

需要注意的是要使用root权限,才能看得到具体的PID信息。

ss -anp | grep .7777

然后可以通过ps aux命令找到具体是那条命令在跑着。然后对症下药,完成整个操作。

查看具体是什么命令在连接redis


总结

回顾一下,这篇文章主要是为了谈谈对线上redis升级的体会,以及一些常识性的内容的叙述。为了循序渐进,讲了QPSRedis的主从同步的具体操作步骤,最后引出升级的步骤和过程。

其实步骤什么的不重要,重要的在于整体的思路,还有对工具的使用的熟练程度。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
线上升级Redis纪实
QPS相关 QPS,每秒处理请求数。可以在一定程度上反映某个服务此时的压力情况。下面可以通过一个案例来分析下如何大致的估算一个服务的QPS。 背景:昨天上线的一个活动,会根据唱歌时间来进行送券行为,计算下此送券行为的QPS。
1195 0
1周上线系统,效率提升100%,宜搭助力阿里巴巴法务数字化升级
新系统借助“宜搭”平台,打破了原先的数据孤岛,把业务人员从大量简单、繁琐的法务工作中释放了出来,实现了集团知识产权的全生命周期管理。据统计,系统上线7天即实现上万数据入库,累计承载数十万权利数据的管理和运营。
4823 0
云数据库Redis版备份恢复解决方案上线,数据可靠性全面升级!
阿里云云数据库Redis版致力于为用户提供稳定可靠、性能卓越、可弹性伸缩的数据库服务,并提供全套的容灾切换、故障迁移、在线扩容、性能优化的数据库解决方案。 云数据库Redis版采用双击热备的架构保证服务高可用,并且提供了持久化机制来保证数据可靠性。但是随着越来越多的
8512 0
数智洞察 | 数字新基建推动消费升级和产业升级
中国在2019年成为了全球最大的单一市场,今天消费市场的形态已经不同从前,对于民众更高水平的消费需求,产业如何回应,消费互联网和工业互联网如何互动?本文将深入浅出解析数字新基建如何推动消费和产业升级。
89 0
+关注
郭璞
一切就交给时间,它会给我答案。
369
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《Nacos架构&原理》
立即下载
《看见新力量:二》电子书
立即下载
云上自动化运维(CloudOps)白皮书
立即下载