使用ZooKeeper原生API实现分布式锁

2022-10-24 232

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

Redis 开源版，标准版 2GB

云数据库 Tair（兼容Redis），内存型 2GB

服务治理 MSE Sentinel/OpenSergo，Agent数量不受限

简介： 分布式锁的引入一个很典型的秒杀场景，或者说并发量非常高的场景下，对商品库存的操作，我用一个SpringBoot小项目模拟一下。用到的技术知识：SpringBootRedisZooKeeper我提前将库存 stock 放在redis，初始值为288：

分布式锁的引入

一个很典型的秒杀场景，或者说并发量非常高的场景下，对商品库存的操作，我用一个SpringBoot小项目模拟一下。

用到的技术知识：

SpringBoot
Redis
ZooKeeper

我提前将库存 stock 放在redis，初始值为288：

127.0.0.1:6379> set stock 288
OK
127.0.0.1:6379> get stock
"288"
复制代码

扣减库存的api：

@RequestMapping("/v1/reduce")
public String reduceStock() {
    String stockStr = redisTemplate.opsForValue().get("stock");
    int stock = Integer.parseInt(stockStr);
    if (stock > 0) {
        int realStock = stock - 1;
        redisTemplate.opsForValue().set("stock", String.valueOf(realStock));
        System.out.println(Thread.currentThread().getName() + " 减库存成功，剩余库存：" + realStock);
    } else {
        System.out.println("不能再减了，没有库存了！");
    }
    return port + ": reduce stock end";
}
复制代码

单机环境下的高并发：

网络异常，图片无法展示

我用 Apache JMeter 模拟在同一时刻，有 500 个请求打到 /stock/v1/reduce 上进行减库存的操作：

网络异常，图片无法展示

Apache JMeter是Apache组织开发的基于Java的压力测试工具。用它很容易模拟出高并发场景。

Apache JMeter官网：
jmeter.apache.org/download_jm…

启动SpringBoot项目，执行压测，运行结果：

网络异常，图片无法展示

500个并发，才扣减了5个！！！BOSS该找你事了！

不过这种情况我们程序员是不会让它出现的，加个 synchronized ，让每个线程拿到锁之后再去扣减库存：

网络异常，图片无法展示

代码实现：

@RequestMapping("/v2/reduce")
public String reduceStockV2() {
    //加线程同步
    synchronized (this) {
        String stockStr = redisTemplate.opsForValue().get("stock");
        int stock = Integer.parseInt(stockStr);
        if (stock > 0) {
            int realStock = stock - 1;
            redisTemplate.opsForValue().set("stock", String.valueOf(realStock));
            System.out.println(Thread.currentThread().getName() + " 减库存成功，剩余库存：" + realStock);
        } else {
            System.out.println("不能再减了，没有库存了！");
        }
    }
    return port + ": reduce stock end";
}
复制代码

压测结果：

网络异常，图片无法展示

synchronized只能帮我们解决单进程内的线程安全问题，而事实上，在分布式环境下，我们一个服务，比如这个扣减库存的服务，可能存在于多个服务器（多个tomcat进程）中，再使用 synchronized 就无法解决分布式服务下的高并发问题了。

我们来模拟一下分布式环境下的高并发问题，我本地开启两个扣减库存的服务，一个8080端口，一个8090端口，使用Nginx做反向代理：

网络异常，图片无法展示

我的Nginx服务器的IP地址为 192.168.134.135 ，我开启 200个线程 ， 循环4次 ，相当于一共有 800 次访问
http://192.168.134.135/stock/v2/reduce ，如此就可以模拟出分布式下的高并发场景了。

网络异常，图片无法展示

开始压测：

网络异常，图片无法展示

压测结果：

服务1：

网络异常，图片无法展示

服务2：

网络异常，图片无法展示

发现 synchronized 根本没用，很多线程还是重复扣减了库存！！！

这种时候就需要 分布式锁 来解决这个问题了。

使用ZooKeeper实现分布式锁

本案例采用zk自己的api实现分布式锁。当然还可以使用第三方提供的api实现zk分布式锁，比如 Curator （现在Curator也归属于Apache了）。

Curator官网：curator.apache.org/

后续会考虑出一个Curator版本的zk分布式锁的实现。本文提供的方式掌握了，其他版本就不在话下了，哈哈！

为什么zk能实现分布式锁呢？我们之前已经了解过zk拥有类似于Linux文件系统的数据结构，还有一套事件监听机制。

网络异常，图片无法展示

zk的数据结构中，每个节点还可以存数据，这个就比较厉害了。还可以创建顺序节点，节点带编号。临时节点还有随session存在而存在的特性，所以当客户端失去连接的时候session消亡，临时节点也就消失了。

还有，zk的事件监听机制。zk上所有的节点，持久节点，顺序节点，临时顺序节点等都可以对它进行监听，当某一个节点上发生了变化，比如当节点被创建了、数据更新、 节点被删除 等，这些 事件都会被监听 到，同时 触发回调 ，那么我们在代码中就能够做一些相应的处理。

网络异常，图片无法展示

这里其实有个问题，如果我们只关注 /lock 节点的话，并发量一高会带来通信压力，因为很多client都watch了 /lock 节点，当 /lock 节点发生变化，这些client一窝蜂的进行事件回调争抢锁，压力就出现了。

zk的临时顺序节点能帮我们解决这个问题，我们只监听顺序节点的前一个节点，看它是不是顺序最小的，让顺序最小的获得锁！

网络异常，图片无法展示

因此，基于zk的 临时顺序节点 和 事件监听 ，我们就可以实现 分布式锁 。

代码实现

总体框架，三大步：

争抢锁
做自己爱做的事情
释放锁

先把这个架子搭起来：

@RequestMapping("/v3/reduce")
public String reduceStockV3() {
    try {
        //1. 抢锁
        tryLock
        //2. 做自己爱做的事
        //比如减库存
        //3. 释放锁
        releaseLock
    } catch (Exception e) {
        e.printStackTrace();
    }
    return port + ": reduce stock end";
}
复制代码

zk API的响应式编程很爽，前文使用ZooKeeper客户端原生API实现分布式配置中心就是用的是响应式编程。

响应式编程很好理解，就是对事件加监听，当完成某个事件的时候，就出发相应的回调函数，zk的很多api都提供了方法的异步调用版本。

前文分析，实现分布式锁的流程是：抢锁就是创建临时有序节点，监听创建成功后，获取根节点（连接zk集群时候的根节点）下的所有孩子节点，然后比较当前节点时候为第一个（要排好序），若是第一个，则抢锁成功，做自己的业务，然后释放锁-删除节点，当然删除节点也会触发回调。

因此，核心代码逻辑都在 监听回调 里，抽象出一个 WatchAndCallback 出来：

public class WatchAndCallback implements Watcher, AsyncCallback.StringCallback, AsyncCallback.Children2Callback, AsyncCallback.StatCallback {
    //肯定得有zookeeper
    private final ZooKeeper zk;
    //创建的节点名称，节点监听它的前一个顺序节点时需要用到
    private String pathName;
    //也得有CountDownLatch，用来保证程序阻塞与继续执行
    private final CountDownLatch latch = new CountDownLatch(1);
    //线程名称，辅助观察
    private final String threadName;
    public WatchAndCallback(ZooKeeper zk, String threadName) {
        this.zk = zk;
        this.threadName = threadName;
    }
    //Children2Callback
    //此回调用于检索节点的子节点和stat
    //处理异步调用的结果
    // List<String> children 给定路径上节点的子节点的无序数组，基于watch前一个节点，最小节点获得锁的机制，需要给children排个序
    @Override
    public void processResult(int rc, String path, Object ctx, List<String> children, Stat stat) {
        //实现分布式锁的核心
    }
    //StatCallback
//    处理异步调用的结果
//    成功, rc is KeeperException.Code.OK.
//    失败, rc is set to the corresponding failure code in KeeperException.
    @Override
    public void processResult(int rc, String path, Object ctx, Stat stat) {
        //TODO
    }
    //创建节点时的回调 StringCallback
    //此回调用于检索节点的名称
    // name: 创建的znode的名称。如果成功，名称和路径通常相等，除非创建了顺序节点。
    @Override
    public void processResult(int rc, String path, Object ctx, String name) {
    }
    //Watcher
    //如果某个线程释放锁了，也就是节点被删除了，也要触发监听
    //如果不是释放锁而是某个节点本身出问题了，zk也会删除node，也需要一个监听
    @Override
    public void process(WatchedEvent watchedEvent) {
    }
}
复制代码

我把分布式锁的代码逻辑都放在 WatchAndCallback 类中。

抢锁，tryLock

/**
 * 抢锁---zk节点具有互斥性，当已存在该节点时会创建失败，所以创建临时节点可以知道是否抢锁成功
 * @author 行百里者
 * @create 2020/9/18 15:37
 **/
public void tryLock() {
    System.out.println(threadName + " 试图抢锁");
    //创建临时序列节点，data就设置为当前线程名字即可，实际业务可设置为用户id
    //创建节点也有callback，传一个this即可，会触发调用processResult(int rc, String path, Object ctx, String name)
    zk.create("/stock",
            threadName.getBytes(),
            ZooDefs.Ids.OPEN_ACL_UNSAFE,
            CreateMode.EPHEMERAL_SEQUENTIAL,
            this,
            "create node ctx");
    //异步的，要await一下
    try {
        latch.await();
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
}
复制代码

减库存，保存lucky（实际场景中的订单信息）

在 controller 中，也就是说当一个客户抢锁成功，就要对数据做相应的改变：

//2. 做自己爱做的事
int stock = Integer.parseInt(redisTemplate.opsForValue().get("stock"));
if (stock > 0) {
    int realStock = stock - 1;
    redisTemplate.opsForValue().set("stock", String.valueOf(realStock));
    //同时lucky+1
    redisTemplate.opsForValue().increment("lucky");
} else {
    System.out.println("库存不足");
}
复制代码

给别人机会，释放锁，releaseLock

//也就是删除临时节点
public void releaseLock() {
    try {
        zk.delete(pathName, -1);
        System.out.println(threadName + " 流程走完了，释放锁");
    } catch (InterruptedException e) {
        e.printStackTrace();
    } catch (KeeperException e) {
        e.printStackTrace();
    }
}
复制代码

压力测试

还是用JMeter模拟高并发场景，一次并发800个请求打到nginx上，nginx反向代理到两个tomcat。

首先开启两个tomcat：

网络异常，图片无法展示

初始化库存仍设置为288（redis），同时在设置一个 lucky ，表示有多少人抢到了库存中的数据，这个数据最终为288才是正确的：

127.0.0.1:6379> set stock 288
OK
127.0.0.1:6379> get stock
"288"
127.0.0.1:6379> set lucky 0
OK
127.0.0.1:6379> get lucky
"0"
复制代码

初始化zk lock根节点：

[zk: localhost:2181(CONNECTED) 5] ls /lock
[]
复制代码

压力测试：

网络异常，图片无法展示

看一下后台redis中存储的stock和lucky数据：

127.0.0.1:6379> get stock
"0"
127.0.0.1:6379> get lucky
"288"
127.0.0.1:6379> 
复制代码

stock为0说明没有超卖，lucky=288说明也没有同一个库存扣减多次的情况。

ok，zk实现分布式锁就是这么完美！

小结

zk实现分布式锁：

争抢锁，只有一个能获得锁
获得锁的人，如果故障了，导致死锁，用 zookeeper 实现分布式锁解决，基于zk的特征，可以创建临时节点，产生一个session，它如果挂了，session会消失，然后释放锁，因此 ZooKeeper能规避死锁 。
获得锁的人成功了，释放锁
锁被释放/删除，别人怎么知道？方式1：for循环，主动轮询，发送心跳，这种方式的弊端：延迟（实时性不强），压力（服务很多，都去轮询访问某一把锁）方式2：watch 解决延迟问题，此法也有弊端：通信压力（watch完了很多服务器回调去抢锁）方式3： 临时顺序节点 + 事件监听机制 （序列节点+watch） watch谁？watch前一个节点，最小的获得锁，一旦最小的释放锁，此法的效率成本是 ZooKeeper只给第二个node发事件回调 。

网络异常，图片无法展示

使用ZooKeeper原生API实现分布式锁

分布式锁的引入

使用ZooKeeper实现分布式锁

代码实现

压力测试

小结

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

使用ZooKeeper原生API实现分布式锁

分布式锁的引入

使用ZooKeeper实现分布式锁

代码实现

压力测试

小结

热门文章

最新文章

相关课程

相关电子书

相关实验场景