Redis集群
问题
容量不够,redis如何进行扩容?
并发写操作, redis如何分摊?
另外,主从模式,薪火相传模式,主机宕机,导致ip地址发生变化,应用程序中配置需要修改对应的主机地址、端口等信息。
之前通过代理主机来解决,但是redis3.0中提供了解决方案。就是无中心化集群配置。
什么是集群
Redis 集群实现了对Redis的水平扩容,即启动N个redis节点,将整个数据库分布存储在这N个节点中,每个节点存储总数据的1/N。(也就是上面的用户,订单,商品)
Redis 集群通过分区(partition)来提供一定程度的可用性(availability): 即使集群中有一部分节点失效或者无法进行通讯, 集群也可以继续处理命令请求。
操作实例
首先吧我们之前操作的数据删除,也就是删除rdb文件
命令:rm -rf dump63* 删除带dump63的所有文件
建6个实例,6379,6380,6381,6389,6390,6391
和之前一样的,6个conf文件,不过里面新增了一些东西
集群conf配置
- cluster-enabled yes 打开集群模式
- cluster-config-file nodes-6379.conf 设定节点配置文件名
- cluster-node-timeout 15000 设定节点失联时间,超过该时间(毫秒),集群自动进行主从切换。
- 注意开启daemonize yes(RDB)和Appendonly (AOF)关掉或者换名字
vi中使用查找替换修改另外5个文件的快速操作
例如::%s/6379/6380 全局替换6379替换6380
include /home/bigdata/redis.conf port 6379 pidfile "/var/run/redis_6379.pid" dbfilename "dump6379.rdb" dir "/home/bigdata/redis_cluster" logfile "/home/bigdata/redis_cluster/redis_err_6379.log" clu - ster-enabled yes cluster-config-file nodes-6379.conf cluster-node-timeout 15000
完成之后就可以启动6个redis服务
将六个节点合成一个集群(无中心集群)
组合之前,请确保所有redis实例启动后,nodes-xxxx.conf文件都生成正常。在目录中ll查看,前面的文件就是之前conf配置的节点文件(cluster-config-file nodes-6379.conf)
合成集群:
在redis6中已经封装好了合成集群的命令操作
先打开redis本地目录 cd /opt/redis-6.2.1/src,需要在这个目录下执行下面的命令
redis-cli --cluster create --cluster-replicas 1 192.168.11.101:6379 192.168.11.101:6380 192.168.11.101:6381 192.168.11.101:6389 192.168.11.101:6390 192.168.11.101:6391
此处不要用127.0.0.1, 请用真实IP地址--replicas 1 采用最简单的方式配置集群,一台主机,一台从机,正好三组。
下面是redis给你提供的分配方案
登录
普通方式登录可能直接进入读主机,存储数据时,会出现MOVED重定向操作。所以,应该以集群方式登录。
-c 登录,采用集群策略连接,设置数据会自动切换到相应的写主机
通过 cluster nodes 命令查看集群信息
redis cluster 如何分配这六个节点?
上面合成集群命令解析
一个集群至少要有三个主节点。
选项--cluster-replicas 1 表示我们希望为集群中的每个主节点创建一个从节点。
分配原则尽量保证每个主数据库运行在不同的IP地址,每个从库和主库不在一个IP地址上。
什么是slots
(新概念,下面会用到的,读一下就好)
[OK] All nodes agree about slots configuration.
在集群中录入值
在redis-cli每次录入、查询键值,redis都会计算出该key应该送往的插槽slot,如果不是该客户端对应服务器的插槽,redis会报错,并告知应前往的redis实例地址和端口。
redis-cli客户端提供了 –c 参数实现自动重定向。
如 redis-cli -c –p 6379 登入后,再录入、查询键值对可以自动重定向。
不在一个slot下的键值,是不能使用mget,mset等多键操作。
可以通过{}来定义组的概念,从而使key中{}内相同内容的键值对放到一个slot中去。
mset k1{cust} v1 k2{cust} v2 解释:cust对象里的k1键v1值。
查询集群中的值
cluster keyslot cust 看查cust的插槽位置
cluster countkeysinslot 4847 查看插槽4847中有多少值
CLUSTER GETKEYSINSLOT 返回 count 个 slot 槽中的键。(在后面加数据可以看出第几个键的值)
故障恢复
如果主节点下线?从节点能否自动升为主节点?注意:15秒超时
例如挂掉6379。
主节点恢复后,主从关系会如何?主节点回来变成从机。
问:如果所有某一段插槽的主从节点都宕掉,redis服务是否还能继续?
答:如果某一段插槽的主从都挂掉,而cluster-require-full-coverage 为yes ,那么 ,整个集群都挂掉
如果某一段插槽的主从都挂掉,而cluster-require-full-coverage 为no ,那么,该插槽数据全都不能使用,也无法存储。
redis.conf中的参数 cluster-require-full-coverage
集群的Jedis开发
即使连接的不是主机,集群会自动切换主机存储。主机写,从机读。
无中心化主从集群。无论从哪台主机写的数据,其他主机上都能读到数据。
public class JedisClusterTest { public static void main(String[] args) { Setset =new HashSet(); set.add(new HostAndPort("192.168.31.211",6379)); JedisCluster jedisCluster=new JedisCluster(set); jedisCluster.set("k1", "v1"); System.out.println(jedisCluster.get("k1")); } }
Redis 集群提供了以下好处
- 实现扩容
- 分摊压力
- 无中心配置相对简单
Redis 集群的不足
- 多键操作是不被支持的
- 多键的Redis事务是不被支持的。lua脚本不被支持
- 由于集群方案出现较晚,很多公司已经采用了其他的集群方案,而代理或者客户端分片的方案想要迁移至redis cluster,需要整体迁移而不是逐步过渡,复杂度较大。
Check for open slots... Check slots coverage... [OK] All 16384 slots covered.
一个 Redis 集群包含16384个插槽(hash slot), 数据库中的每个键都属于这 16384 个插槽的其中一个, 集群使用公式 CRC16(key) % 16384 来计算键 key 属于哪个槽, 其中 CRC16(key) 语句用于计算键 key 的 CRC16 校验和 。
集群中的每个节点负责处理一部分插槽。 举个例子, 如果一个集群可以有主节点, 其中:
节点 A 负责处理 0 号至 5460 号插槽。节点 B 负责处理 5461 号至 10922 号插槽。节点 C 负责处理 10923 号至 16383 号插槽。
这个东西是确保在无中心化集群中读写是能找到正确的数据的关键。
Redis的应用问题解决
缓存穿透
穿过redis缓存直接访问数据库
问题描述
key对应的数据在数据源(数据库)并不存在,每次针对此key的请求从缓存获取不到,请求都会压到数据源,从而可能压垮数据源。比如用一个不存在的用户id获取用户信息,不论缓存还是数据库都没有,若黑客利用此漏洞进行攻击可能压垮数据库。
16.1.2. 解决方案
一个一定不存在缓存及查询不到的数据,由于缓存是不命中时被动写的,并且出于容错考虑,如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。
解决方案:
(1) 对空值缓存:如果一个查询返回的数据为空(不管是数据是否不存在),我们仍然把这个空结果(null)进行缓存,设置空结果的过期时间会很短,最长不超过五分钟
(2) 设置可访问的名单(白名单):使用bitmaps类型定义一个可以访问的名单,名单id作为bitmaps的偏移量,每次访问和bitmap里面的id进行比较,如果访问id不在bitmaps里面,进行拦截,不允许访问。就是白名单。
(3) 采用布隆过滤器:(布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量(位图)和一系列随机映射函数(哈希函数)。我也不清楚。
布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难。)
将所有可能存在的数据哈希到一个足够大的bitmaps中,一个一定不存在的数据会被 这个bitmaps拦截掉,从而避免了对底层存储系统的查询压力。
(4) 进行实时监控:当发现Redis的命中率开始急速降低,需要排查访问对象和访问的数据,和运维人员配合,可以设置黑名单限制服务
缓存击穿
缓存击穿是指缓存中没有但数据库中有的数据(一般是缓存时间到期),这时由于并发用户特别多,同时读缓存没读到数据,又同时去数据库去取数据,引起数据库压力瞬间增大,造成过大压力
问题描述
key对应的数据存在,但在redis中过期,此时若有大量并发请求过来,这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端DB压垮。