开发者社区> 小生生> 正文

详细解读云数据库Redis高性能分布式锁

简介: 分布式锁是大型应用中最常见的功能之一,基于Redis实现分布式锁的方式有很多。本章节先介绍并分析常见的分布式锁实现方式,之后结合阿里巴巴集团在使用云数据库Redis企业版和分布式锁方面的业务经验,介绍使用Redis企业版实现高性能分布式锁的实践方案。
+关注继续查看

云栖号快速入门:【点击查看更多云产品快速入门】
不知道怎么入门?这里分分钟解决新手入门等基础问题,可快速完成产品配置操作!

分布式锁是大型应用中最常见的功能之一,基于Redis实现分布式锁的方式有很多。本章节先介绍并分析常见的分布式锁实现方式,之后结合阿里巴巴集团在使用云数据库Redis企业版和分布式锁方面的业务经验,介绍使用Redis企业版实现高性能分布式锁的实践方案。

分布式锁及其应用场景

应用开发时,如果需要在同进程内的不同线程并发访问某项资源,可以使用各种互斥锁、读写锁;如果一台主机上的多个进程需要并发访问某项资源,则可以使用进程间同步的原语,例如信号量、管道、共享内存等。但如果多台主机需要同时访问某项资源,就需要使用一种在全局可见并具有互斥性的锁了。这种锁就是分布式锁,可以在分布式场景中对资源加锁,避免竞争资源引起的逻辑错误。
image

分布式锁的特性

  • 互斥性
    在任意时刻,只有一个客户端持有锁。
  • 不死锁
    分布式锁本质上是一个基于租约(Lease)的租借锁,如果客户端获得锁后自身出现异常,锁能够在一段时间后自动释放,资源不会被锁死。
  • 一致性
    硬件故障或网络异常等外部问题,以及慢查询、自身缺陷等内部因素都可能导致Redis发生高可用切换,replica提升为新的master。此时,如果业务对互斥性的要求非常高,锁需要在切换到新的master后保持原状态。

使用原生Redis实现分布式锁

BE430C1F_F020_4b97_85BA_4E6EF4304685

  • 加锁
    在Redis中加锁非常简便,直接使用SET命令即可。示例及关键选项说明如下:
SET resource_1 random_value NX EX 5

表 1. 关键选项说明
2371933C_2F71_491a_80A4_3DA69651B2B8

示例代码为resource_1这个key设置了5秒的过期时间,如果客户端不释放这个key,5秒后key将过期,锁就会被系统回收,此时其它客户端就能够再次为资源加锁并访问资源了。

  • 解锁
    解锁一般使用DEL命令,但可能存在下列问题。

image

(1).t1时刻,App1设置了分布式锁resource_1,过期时间为3秒。
(2).App1由于程序慢等原因等待超过了3秒,而resource_1已经在t2时刻被释放。
(3).t3时刻,App2获得这个分布式锁。
(4).App1从等待中恢复,在t4时刻运行3B4ADCAC_B3BD_4285_AE19_D18D1EA96E8F将App2持有的分布式锁释放了。

从上述过程可以看出,一个客户端设置的锁,必须由自己解开。因此客户端需要先使用GET命令确认锁是不是自己设置的,然后再使用DEL解锁。在Redis中通常需要用Lua脚本来实现自锁自解:

if redis.call("get",KEYS[1]) == ARGV[1] then
    return redis.call("del",KEYS[1])
else
    return 0
end
  • 续租
    当客户端发现在锁的租期内无法完成操作时,就需要延长锁的持有时间,进行续租(renew)。同解锁一样,客户端应该只能续租自己持有的锁。在Redis中可使用如下Lua脚本来实现续租:
if redis.call("get",KEYS[1]) == ARGV[1] then
    return redis.call("expire",KEYS[1], ARGV[2])
else
    return 0
end

使用Redis企业版实现分布式锁

使用Redis企业版性能增强型实例的String增强命令,无需Lua即可实现分布式锁。

  • 加锁
    加锁方式与原生Redis相同,使用SET命令:
SET resource_1 random_value NX EX 5
  • 解锁
    直接使用Redis企业版的CAD命令即可实现优雅而高效的解锁:
/* if (GET(resource_1) == my_random_value) DEL(resource_1) */
CAD resource_1 my_random_value
  • 续租
    续租可以直接使用CAS命令实现:
CAS resource_1 my_random_value my_random_value EX 10

FD416D6E_A930_47d6_9F6F_880A4CFB2A1A

基于Jedis的示例代码

  • 定义CAS/CAD命令
enum TairCommand implements ProtocolCommand {
    CAD("CAD"), CAS("CAS");

    private final byte[] raw;

    TairCommand(String alt) {
      raw = SafeEncoder.encode(alt);
    }

    @Override
    public byte[] getRaw() {
      return raw;
    }
}
  • 加锁
public boolean acquireDistributedLock(Jedis jedis,String resourceKey, String randomValue, int expireTime) {
    SetParams setParams = new SetParams();
    setParams.nx().ex(expireTime);
    String result = jedis.set(resourceKey,randomValue,setParams);
    return "OK".equals(result);
}
  • 解锁
public boolean releaseDistributedLock(Jedis jedis,String resourceKey, String randomValue) {
    jedis.getClient().sendCommand(TairCommand.CAD,resourceKey,randomValue);
    Long ret = jedis.getClient().getIntegerReply();
    return 1 == ret;
}
  • 续租
public boolean renewDistributedLock(Jedis jedis,String resourceKey, String randomValue, int expireTime) {
    jedis.getClient().sendCommand(TairCommand.CAS,resourceKey,randomValue,randomValue,"EX",String.valueOf(expireTime));
    Long ret = jedis.getClient().getIntegerReply();
    return 1 == ret;
}

如何保障一致性

Redis的主从同步(replication)是异步进行的,如果向master发送请求修改了数据后master突然出现异常,发生高可用切换,缓冲区的数据可能无法同步到新的master(原replica)上,导致数据不一致。如果丢失的数据跟分布式锁有关,则会导致锁的机制出现问题,从而引起业务异常。下文介绍三种保障一致性的方法。

  • 使用红锁(RedLock)
    红锁是Redis作者提出的一致性解决方案。红锁的本质是一个概率问题:如果一个主从架构的Redis在高可用切换期间丢失锁的概率是k%,那么相互独立的N个Redis同时丢失锁的概率是多少?如果用红锁来实现分布式锁,那么丢锁的概率是(1-k%)^N。鉴于Redis极高的稳定性,此时的概率已经完全能满足产品的需求。

A45E61E8_DE46_4ea1_89BB_544D08129864

红锁的问题在于:

(1).加锁和解锁的延迟较大。
(2).难以在集群版或者标准版(主从架构)的Redis实例中实现。
(3).占用的资源过多,为了实现红锁,需要创建多个互不相关的云Redis实例或者自建Redis。

  • 使用WAIT命令。
    Redis的WAIT命令会阻塞当前客户端,直到这条命令之前的所有写入命令都成功从master同步到指定数量的replica,命令中可以设置单位为毫秒的等待超时时间。在云Redis版中使用WAIT命令提高分布式锁一致性的示例如下:
SET resource_1 random_value NX EX 5
WAIT 1 5000

使用以上代码,客户端在加锁后会等待数据成功同步到replica才继续进行其它操作,最大等待时间为5000毫秒。执行WAIT命令后如果返回结果是1则表示同步成功,无需担心数据不一致。相比红锁,这种实现方法极大地降低了成本。

需要注意的是:

(1).WAIT只会阻塞发送它的客户端,不影响其它客户端。
(2).WAIT返回正确的值表示设置的锁成功同步到了replica,但如果在正常返回前发生高可用切换,数据还是可能丢失,此时WAIT只能用来提示同步可能失败,无法保证数据不丢失。您可以在WAIT返回异常值后重新加锁或者进行数据校验。
(3).解锁不一定需要使用WAIT,因为锁只要存在就能保持互斥,延迟删除不会导致逻辑问题。

  • 使用阿里云数据库Redis企业版

在不考虑组合方案的情况下:

(1).使用红锁最大优势是Redis节点越多则一致性越强。
(2).使用WAIT命令最大优势是实现成本低。

如果使用阿里云数据库Redis企业版:

(1).其特有的高可用HA和数据持久化机制能够有效保护数据安全、确保服务的稳定性,不使用多Redis节点或WAIT命令也能提供较高的一致性。
(2).性能增强型实例的CAS/CAD命令可以极大降低分布式锁的开发和管理成本,提升锁的性能。
(3).性能增强型实例的多线程性能增强特性使其能够提供三倍于原生Redis的性能,即使是大并发的分布式锁也不会影响正常的Redis服务。

本文来自 阿里云文档中心 云数据库Redis 高性能分布式锁

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
【阿里云】 ECS Linux 云服务器中安装 rinetd 进行转发实现本地通过公网访问云数据库 Redis
【阿里云】 ECS Linux 云服务器中安装 rinetd 进行转发实现本地通过公网访问云数据库 Redis
210 0
云数据库Redis FAQ
云数据库Redis FAQ
180 0
云数据库 Redis清除数据的步骤
云数据库 Redis清除数据的步骤
601 0
全球首发 | 阿里云正式推出云数据库Redis 6.0版本
千呼万唤,云数据库 Redis 6.0 版终于来啦!
2160 0
云数据库 Redis创建专属集群的注意事项及步骤
您需要先创建专属集群,才能使用专属集群内的各项功能。
719 0
云数据库 Redis清除数据的步骤
您可以在控制台清除Redis实例中的数据,可选清除对象为所有数据或过期数据。
631 0
从事前到事后,云数据库 Redis & MongoDB 安全体系全揭秘!
相比自建,阿里云数据库针对控制链路和数据链路提供了多个维度的安全保障体系,更好的保障客户的数据安全,本文将为您详细介绍云数据库Redis&MongoDB的安全体系。
2394 0
全方位解析云数据库Redis灾备简介!
数据是很多业务的核心元素,作为数据载体的数据库承担着举足轻重的责任。本文将全方位地为您解析云数据库Redis版的灾备机制。
4745 0
云数据库Redis版如何备份与恢复?
本文主要介绍如何对云数据库Redis版进行数据的备份与恢复。 数据备份有两种模式:第一种是手动备份模式;第二种是系统自动备份模式。其中手动备份又分为两种,第一种是备份在阿里云存储OSS上,第二种是备份在本地磁盘上。
1546 0
云数据库Redis版数据库如何进行管理?
本文将简单介绍如何操作云数据库Redis版。云数据库Redis版有两种操作模式,分别为视图模式和命令窗口模式。 云数据库Redis版共支持DB0到DB255,共256个分库。 在视图模式下,可在左侧菜单栏通过按钮操作进行数据的增删改查。
4569 0
云数据库Redis实例如何创建?
本文重点介绍如何开通阿里云云数据库Redis版实例及进行实例的登录。 首先,进入阿里云官网,依次点击产品→数据库,选择NoSQL数据库以下的Redis,进入云数据库Redis版产品详情页。 点击立即购买,进入购买页面。
1134 0
企业打开Redis的正确方式,来自阿里云云数据库团队的解读
Redis是开源的基于内存且可以持久化的分布式 Key – Value数据库。自2009年发布最初版本以来,Redis的热度只增不减,除了经常位居DB-Engines的最受欢迎Key-Value数据库榜首之外,看阿里云技术总监为您深度解读云数据库Redis。
4756 0
+关注
小生生
文章
问答
视频
相关电子书
更多
Redis Cluster的基本原理
立即下载
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载