redis分布式锁的实现原理-阿里云开发者社区

redis分布式锁的实现原理

2022-06-10 1525

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

Redis 开源版，标准版 2GB

云数据库 Tair（兼容Redis），内存型 2GB

简介： redis分布式锁的实现原理

一、redis分布式锁的简易实现

二、redis分布式锁的注意事项

1. 锁必须要设定一个过期时间

2. 获取锁的命令不能分为两步执行

3. 锁的值必须设置为随机值

4. 释放锁时，需使用lua script封装保证原子性

5. 多个redis节点保证高可用

三、redsync实现一览

1. Lock

2. Unlock

3. Extend

一、redis分布式锁的简易实现

用redis实现分布式锁是一个老生常谈的问题了。因为redis单条命令执行的原子性和高性能，当多个客户端执行setnx(相同key)时，最多只有一个获得成功。因此在对可用性要求不是特别高的场景下，redis分布式锁方案不失为一个性价比高的实现。

多个客户端执行setnx lockid random px lock-duration

其中lockid与被锁住资源唯一对应。random为随机值，用于客户端判定自身是否为该锁的owner。lock-duration为锁保持时长，由业务操作耗时决定。

对于客户端来说，执行命令后，如果redis返回1，则表示抢到锁；否则没抢到

对于抢到锁的客户端，完成业务操作之后，需主动删除该锁。

二、redis分布式锁的注意事项

1. 锁必须要设定一个过期时间

如果不设置过期时间，考虑如下时序：

客户端A抢锁成功

客户端A的进程异常退出，没来得及主动释放锁

其他客户端试图抢锁(毫无疑问是失败的)

如上所示，客户端A抢到锁了，但是由于某些异常导致进程还没有来得及释放锁就退出了。这样其他客户端setnx的返回永远是0，即永远也抢不到锁。

相反，如果设置过期时间，即使客户端A没有主动释放锁，到了过期时间之后redis也会自动释放。

客户端A抢锁成功

客户端A的进程异常退出，没来得及主动释放锁

其他客户端抢锁失败

锁自动过期

其他客户端抢锁成功

2. 获取锁的命令不能分为两步执行

如果实现为，

setnx lockid
expire lockid lock-duration

除非使用lua script, 否则redis无法支持上述两个命令的原子性，当第一个命令执行完成后，抢到锁的客户端A异常退出了，那么其他客户端将永远抢到锁。

注：redis在2.6.12版本后已经支持setnx命令的TTL参数，这个问题不复存在

3. 锁的值必须设置为随机值

假设锁的值为固定值，考虑如下情况

客户端A抢到锁，执行业务操作

客户端A由于某些原因阻塞，超过了锁有效时间，导致锁自动被释放

客户端B抢锁成功，执行操作

客户端A从阻塞中恢复，主动释放锁，执行del lockid

客户端B创建的锁被客户端A删除。此时客户端C抢锁成功，客户端B与C的业务操作产生竞态。

如果锁的值是随机值，并且每次成功加锁时，都记录该随机值的话，并且释放锁时，判断锁的值是否等于记录值，等于则del, 不等于则跳过。

4. 释放锁时，需使用lua script封装保证原子性

如果不使用lua封装释放锁的逻辑，考虑时序：

客户端A抢到锁，执行业务操作

客户端A完成业务操作，主动释放锁：首先get lockid，发现记录值和锁当前值相等，判定该锁为自己所加。

客户端A由于某些原因阻塞(比如GC)，超过锁有效时间，锁被redis自动释放
客户端B成功抢锁

客户端A从阻塞中恢复，执行下一步del lockid，客户端B加的锁被A释放
客户端C抢锁成功，B与C产生竞态

而redis执行lua script的原子性能避免上述问题。

5. 多个redis节点保证高可用

如果只在一个redis节点上抢锁，如果该节点宕机，将导致所有的客户端都抢不到锁，无法保证服务的高可用。

三、redsync实现一览

redlock是一种基于redis的分布式锁算法。而redsync是redlock算法的golang实现，其暴露了三个API：加锁(Lock)，解锁(Unlock)，续锁(Extend)

1. Lock

首先随机生成一个value

针对所有redis连接，执行set lockid value NX PX lock-duration

如果超过半数连接上的请求都正常返回，且now < start + (1 - factor) * expire，意味着抢锁成功

否则先清理key, 然后重试，重试时间间隔可由用户自定义。

2. Unlock

针对所有redis实例，执行lua脚本。这里会判断key对应的value和Mutex在Lock时使用的value值是否一致，只有一致了执行del命令。此举是为了保证每个客户端不会释放别的客户端创建的锁。

if redis.call("GET", KEYS[1]) == ARGV[1] then
        return redis.call("DEL", KEYS[1])
    else
        return 0
    end

如果有超过半数实例上的请求返回，则意味着释放锁成功。否则判定失败。

3. Extend

Extend操作是为了保证当客户端业务处理时长超过expire时间时，客户端可主动延长锁的过期时间，而无需二次抢锁。针对所有redis连接，执行lua脚本，重新设置过期时间

if redis.call("GET", KEYS[1]) == ARGV[1] then
        return redis.call("pexpire", KEYS[1], ARGV[2])
    else
        return 0
    end

半数以上返回成功，则意味着Extend成功

redis分布式锁的实现原理

一、redis分布式锁的简易实现

二、redis分布式锁的注意事项

1. 锁必须要设定一个过期时间

2. 获取锁的命令不能分为两步执行

3. 锁的值必须设置为随机值

4. 释放锁时，需使用lua script封装保证原子性

5. 多个redis节点保证高可用

三、redsync实现一览

1. Lock

2. Unlock

3. Extend

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

redis分布式锁的实现原理

一、redis分布式锁的简易实现

二、redis分布式锁的注意事项

1. 锁必须要设定一个过期时间

2. 获取锁的命令不能分为两步执行

3. 锁的值必须设置为随机值

4. 释放锁时，需使用lua script封装保证原子性

5. 多个redis节点保证高可用

三、redsync实现一览

1. Lock

2. Unlock

3. Extend

热门文章

最新文章

相关课程

相关电子书

相关实验场景