分布式锁的一些细节问题，值得收藏-阿里云开发者社区

分布式锁的一些细节问题，值得收藏

2023-07-11 76

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

Redis 开源版，标准版 2GB

云数据库 Tair（兼容Redis），内存型 2GB

简介： 分布式锁的一些细节问题，值得收藏

分布式锁问题

我看在技术大群里面有人问分布式锁问题，说是被面试官各种刁难，我是实在看不下去了，面试官意思很明确，你们有造火箭的经验吗，有的话来他们公司造自行车，没有的话：今天面试就到这里了！

但是说实话面试官没必要因为这个问题继续追问，没啥意思，但是又不得不问，确实有些企业用到分布式锁了。

没办法，逼迫你必须得背会它。

接下来就说下群友面试碰到的问题，因为候选人可能自己已经掌握了实现分布式锁的原理，但是被面试官问到细节可能就不清楚了，因此给大家讲下这块。

1. setnx+expire+del

问题-1 如果setnx执行成功，但是在expire执行的时候redis节点宕机了，在这种情况下，锁不会被释放，导致死锁。解决方案：

可以用SET EX PX NX替换setnx+expire
也可以用lua脚本保持原子操作。

问题-2 如果expire时间过短，但是任务执行时间过长，那么锁会因为过期而被删除，其它客户端可以重新获取锁。在这种情况下，多个客户端同时获取到了锁。解决方案：

过期时间足够长，保证任务可以完成。
启动一个守护线程，为即将到期但尚未释放的锁添加时间。
redission

问题-3 如果expire刚好过期，此时删除了这个key，那么当另一个客户端进行获取锁的时候就会抢到锁，那么这个时候当前释放锁的客户端会执行最后的del命令把别的客户端刚才设置的删除了，这个时候就破坏了资源的并发操作。

解决方案：

在这种情况下，我们需要检查正在被删除的锁是否与我们之前获得的锁相同。我们可以在设置它时使用唯一的值，例如直接使用UUID。这样，在删除锁时，我们需要获取锁的对应值，然后与当前节点对象的值进行比较，才能删除锁。

1. uuid = gen()
2. set key uuid ex 5 nx
3. 处理业务逻辑
4. valUUID = get key
5. if valUUID == uuid {delete key} else return

问题-4 假如redis主节点宕机，主从同步延迟或者有问题，那么从成为主之后，客户端就会重新获取到锁，这样也会并发不安全。解决方案：

redlock

问题-5 如果redis发生脑裂，那么也会发生多个客户端并发持有多个锁的问题，所以redis为了解决这个脑裂问题，引入两个配置，只有合理配置这两个参数就可以尽最大努力避免脑裂，细节大家下去自行研究哈。

min-slaves-to-write
min-slaves-max-lag

2. redission

锁过期，但是任务还没执行完成，只需将锁过期时间设置长一点即可。比如拿到锁的线程，开启一个定时的守护线程，每隔一段时间检查一下锁是否还存在，如果存在就延长锁的过期时间，防止锁过期和提前释放。Redisson的底层原理图：

只要线程成功获取到锁，就会启动一个watch dog，它是一个后台线程，每10秒检查一次，如果线程一持有锁，那么它会不断延长锁的生存时间。因此，Redisson是可以解决过期时间到了但是业务还没执行完的问题。

3. redlock

Redlock核心思想是这样的：部署多个redis master节点，确保它们不会同时宕机。而且这些主节点之间是完全独立的，它们之间没有数据同步。同时，我们需要确保使用相同的方法来获取和释放锁。具体获取锁和释放锁的步骤大家下去自行研究。

这个redlock主要是解决一个线程在redis的master节点上持有锁，但是 locked key并没有同步到从节点。就在这时，主节点故障，一个从节点将升级为主节点。别的线程就可以拿到相同的锁，这样锁的安全性就没有了。然后redis的作者antirez才提出了一种先进的分布式锁算法，即redlock。

- END -

分布式锁的一些细节问题，值得收藏