浅析MongoDB中的意向锁

简介: 成熟的数据库设计中,需要一个模块对资源的并发控制进行管理。意向锁就是实现资源并发控制管理的经典方式。在讨论它的概念与设计前,我们先举几个MongoDB的经典场景。 mongoDB 默认是行级并发,我们希望多行并发读写互不影响,但是我们又希望对在dropCollection时,不能有任何对表的读写在操作,这个“不希望”也是双向的,即在对表并发读写时,我们也不希望dropCollection在操作。
成熟的数据库设计中,需要一个模块对资源的并发控制进行管理。意向锁就是实现资源并发控制管理的经典方式。在讨论它的概念与设计前,我们先举几个MongoDB的经典场景。
  1. mongoDB 默认是行级并发,我们希望多行并发读写互不影响,但是我们又希望对在dropCollection时,不能有任何对表的读写在操作,这个“不希望”也是双向的,即在对表并发读写时,我们也不希望dropCollection在操作。

    在执行dbStats命令时,希望和dropDB/insert命令互斥,但是又不影响对表的并发读。

    由于写每个db的每张表,都须要往oplog中写记录,因此oplog是全局的,我们希望在truncate oplog这个全局操作在进行时,任何db对oplog的写操作都被阻塞。

第一个例子中,我们似乎用传统的rwlock就可以解决,在对表进行并发读写前,加rlock,在对表进行dropCollection前,加wlock。 暂不论rwlock的r状态和并发写的行为不一致,至少这样是行得通的。 可是遇到了第二个例子,我们发现rwlock的rw两个状态无法表达我们的锁需求了,到了第三个例子,只要能隐约觉得,这个锁,还得有层级结构。

而意向锁协议,是一种对树形(层级)资源进行并发控制的协议。它由"操作约定"和"冲突矩阵"两部分组成,且看下文。

02

MongoDB中的意向锁的定义

MongoDb使用了简化版的意向锁协议,抛却了SIX状态,保留了 IS/IX/S/X四种锁状态。其冲突矩阵为:

1d59beaec60ecbb91c6d416245a195b55f1e2204
其使用方式为:
  1. 对一个节点加IX/X锁时,必须先(递归)获取其父节点的IX锁。

  2. 对一个节点加IS/S锁时,必须先(递归)获取其父节点的IS锁。

举个例子:MongoDB中的资源层级结构如下:

9618d4d60ae082b8f4a91b2af1c8719925e750c3

在对Collection2中的记录进行读操作时,需要先获得其IS锁。因此先递归获得其父节点Global的IS锁。

7b48665367acedaf0b9240ceeebb8b6dc4d9c6e0

此时,如果执行对Db2的drop操作,则需要获得Db2的X锁,由于Db2 目前处于IS锁状态,且IS锁与X锁互斥,因此锁无法立即获得。

3bdb2365363d38ba2bf9e3590d231140cb5f2cc7

此时,如果执行对collection2的记录的写操作,则需要获得Global的IX锁,Db2的IX锁,Collection2的IX锁,从根节点一路下来,IX与IS状态互不冲突,因此加锁成功。如下图:

0de61e3aec678e373f001285aeb33cd533429a68

通过上述的例子,我们可以发现,意向锁的设计较为简洁,仅仅通过一个矩阵(冲突矩阵),两条原则(递归加锁)就可以满足数据库系统中对资源的并发控制的需求。

03

Mongo中意向锁的实现

虽然意向锁的设计非常简洁,但是理论和工程实践上,我们至少还要考虑如下几点:

  1. 一个高并发读写的db中,IS/IX锁源源不断的加上来,且相互不冲突,在这种条件下,如何避免X锁的饿死。

  2. 如何避免死锁。

带着这两个问题,我们分析mongoDB 意向锁的实现。 整体结构 mongoDB中的意向锁实现主要在 lockmanager.cpp/lockstate.cpp两部分。一个简化的意向锁的原语可以用如下两条语句来表达。

a82a9ed9fe9db2b78ad8e57c3739f872ca2f03fd

比如,我们想要给DB加上X锁,就可以执行 (newLockObject).lock("mydb", MODE_X)。

其整体结构如下图所示:

73a7639619549e411be3590414a3c8f06feba224

BucketArray

上图中,意向锁划分为128个元素的BucketsArray, BucketsArray可以无锁访问,一个lock(ResourceId, LockMode)操作,首先通过Hash(ResourceId)%128 找到对于的bucket,这一步无锁操作非常重要,充分利用了不同ResourceId的无关性,使得意向锁模块具备水平扩展性。

Bucket

每个Bucket是ResourceId->LockHead的哈希表。该哈希表被Bucket对象中的mutex保护。

LockHead

LockHead是对应于某个ResourceId的锁对象。LockHead维护着所有对该ResourceId的锁请求。LockHead由ConflictList和GrantList组成。ConflictList是该锁的等待队列, GrantList是持有锁的对象链表。

思考与尝试

上面我们分析了MongoDB中意向锁的结构图,假设我们现在对db1加了大量的IS锁,现在我们要对db1加IX锁,为了检查IX锁是否和GrantList冲突,需要对GrantList进行遍历进行冲突检测,这样做是不高效的。

21745333bee5f7092dff90de751d1713d3a8de8c
引用计数数组

为了解决这个问题,MongoDB为GrantList和ConflictList增加了引用计数数组。在将一个对象增加到GrantList中时,顺带对grantedCounts[mode] 累加,如果grantedCounts[mode]是从0到1的变化, 则将grantedModes对应的bitMask设置为1。 从GrantList中删除对象时,是一个逆向的对称操作。这样,在判断某个模式是否与GrantList中已有对象冲突时,可以通过对grantedModes和待加节点的mode进行比较,将时间复杂度从O(n)降到O(1)。


3776ad1cdc04445c6e4970f701cb7456ab8b27d8 避免饿死

一个锁请求,如果和GrantList无冲突,就将其添加到GrantList中,并加锁成功,否则就加到ConflictList中,并等待grantedModes变更时,从ConflictList中选择一批与grantedModes兼容的加锁请求进入GrantList。 这是很显然的调度策略。不过这个调度策略无法避免一个问题,如果ConflictList中有X锁在等待,而GrantedList中的IS/IX锁源源不断的进来,那么X锁就一直得不到调度。

为了解决这个问题,MongoDB中为加锁操作增加了compatibleFirst参数。

19e446f004ff47b9968baa65eba50bbda149a87e

该参数的作用机制如下代码诠

0da065d7071d29e5d01c665a89e59bfef455e2b7
1. 如果锁请求与该锁目前的grantModes冲突,则进入等待,这一点毫无疑问。

2. 207行可以看到如果请求与grantModes不冲突,也未必能加锁成功,还要检验锁资源上的compatibleFirstCount, 该变量可以解释为:锁资源的GrantList中compatibleFirst=true的属性的锁请求的元素的个数。如果GrantList中无compatibleFirst的锁请求,且conflictList非空(有等待的锁请求),则将请求加入到conflictList中。

3. 如果获锁成功,则将锁请求加入到GrantList中,并累加锁资源的compatibleFirstCount计数器。

上述第二点,实则提供了等待优先级的概念。如果所有锁请求的compatibleFirst都为false,则上述算法则可以简述成如下更直接,更容易理解的防饿死控制:

bc234321f7bb77a1ca795d6fdcfb44d864974d47
  1. 和grantedModes冲突,则进入等待。这一点毫无疑问。

  2. 和grantedMode不冲突,但和conflictModes冲突,依然进入等待,这一点防止了饿死。

而mongoDB引入的compatibleFirst属性,可以理解为对该简化版模型的一个优化,引入了等待优先级,而且将优先级的设置暴露给了意向锁的使用者。在mongoDB中,只有Global的S/X锁设置了compatibleFirst=true,其解释如下:

2d9503e454e33d317963e3c58c74f551de97d6b1

04

死锁检测

MongoDB意向锁的死锁检测基于广度优先遍历(BFS)算法。某个锁请求是否会产生死锁,等价于 “从有向图中的一点出发,是否可以找到一个环”。如何使用BFS算法找有向图的环,不在本文的讨论范围内。在将死锁检测规约为成环问题的过程中,如何构图是关键,如何描述"点",点与点的依赖关系(边)是什么?读者不妨先自行思考一下。

死锁检测的构图

MongoDB中,一个锁依赖图 G=(V, E), Vi = (Request, Resource, Mode), 即图中的一个点的含义为对某个资源的某种模式的锁请求,一个点Vi对另一个点Vj有依赖 当且仅当 Vj 持有 Vi.Resource的锁,且锁模式与Vi.Mode冲突,且Vj 本身也在等待其他资源。概念有点绕,举个例子。

99ca21ed39e4d4293c27bea7bdc958e2894f3846

上图中,有三个Lock,分别为Lock1, Lock2, Lock3,Lock1当前持有Res1,在等待Res2, Lock2当前持有Res2,在等待Res3,Lock3 当前持有Res3,在等待Res1。很明显死锁了,但是如何将其转化为有向图,使得计算机能帮我们检测死锁呢。

我们从Lock1 Acquire Res2来看, 由于Res2被Lock2持有,所以Lock1 Acquire Res2 依赖 Lock2 Release Res2。 而Lock2 Release Res2 依赖 Lock2 Acquire Res3, Lock2 Acquire Res3 依赖 Lock3 Release Res3。 如下图所示:

76a6f64f96034c37dd6e6f8c462ce7ea2994ce47

图中Release动作的依赖并不是必须的,可以简化成:

2caa34ee26bb8b9fdfeb8968cdab16064baa9f8c

在工程实践中,可以通过GrantList判断某个资源是否被某个锁持有。核心代码如下:

bf55697e18005ed67c2d38377eb65fbf3913cb6f

  1. 代码框架上,使用_queue进行BFS的迭代。
  2. 979行迭代ResourceId对于的Lock的GrantList,如果某个GrantList中的元素也有依赖的Resource,则将其入队。

  3. 970行检查node是否为初始入队元素。根据BFS的性质判断是否成环。


原文发布时间为:2018-10-18
本文作者: Mongoing中文社区
本文来自云栖社区合作伙伴“ Mongoing中文社区”,了解相关信息可以关注“ Mongoing中文社区”。
相关文章
|
NoSQL MongoDB 数据库
【MongoDB 专栏】MongoDB 的并发控制与锁机制
【5月更文挑战第11天】MongoDB的并发控制和锁机制保证数据一致性和性能。全局锁用于特殊情况如数据库初始化,限制并发性能;文档级锁提供更高的并发性,针对单个文档锁定。乐观并发控制利用版本号检查减少锁竞争。在分布式环境下,需协调多节点锁,优化包括合理设计数据模型、调整锁配置和利用分布式事务。未来,MongoDB将持续改进这些机制以应对复杂需求。了解并发控制原理对于数据库开发者至关重要。
769 2
【MongoDB 专栏】MongoDB 的并发控制与锁机制
|
11月前
|
NoSQL MongoDB 数据库
数据库数据恢复—MongoDB数据库数据恢复案例
MongoDB数据库数据恢复环境: 一台操作系统为Windows Server的虚拟机上部署MongoDB数据库。 MongoDB数据库故障: 工作人员在MongoDB服务仍然开启的情况下将MongoDB数据库文件拷贝到其他分区,数据复制完成后将MongoDB数据库原先所在的分区进行了格式化操作。 结果发现拷贝过去的数据无法使用。管理员又将数据拷贝回原始分区,MongoDB服务仍然无法使用,报错“Windows无法启动MongoDB服务(位于 本地计算机 上)错误1067:进程意外终止。”
|
11月前
|
缓存 NoSQL Linux
在CentOS 7系统中彻底移除MongoDB数据库的步骤
以上步骤完成后,MongoDB应该会从您的CentOS 7系统中被彻底移除。在执行上述操作前,请确保已经备份好所有重要数据以防丢失。这些步骤操作需要一些基本的Linux系统管理知识,若您对某一步骤不是非常清楚,请先进行必要的学习或咨询专业人士。在执行系统级操作时,推荐在实施前创建系统快照或备份,以便在出现问题时能够恢复到原先的状态。
1186 79
|
11月前
|
存储 NoSQL MongoDB
MongoDB数据库详解-针对大型分布式项目采用的原因以及基础原理和发展-卓伊凡|贝贝|莉莉
MongoDB数据库详解-针对大型分布式项目采用的原因以及基础原理和发展-卓伊凡|贝贝|莉莉
422 8
MongoDB数据库详解-针对大型分布式项目采用的原因以及基础原理和发展-卓伊凡|贝贝|莉莉
|
10月前
|
运维 NoSQL 容灾
告别运维噩梦:手把手教你将自建 MongoDB 平滑迁移至云数据库
程序员为何逃离自建MongoDB?扩容困难、运维复杂、高可用性差成痛点。阿里云MongoDB提供分钟级扩容、自动诊断与高可用保障,助力企业高效运维、降本增效,实现数据库“无感运维”。
|
NoSQL MongoDB 数据库
数据库数据恢复——MongoDB数据库服务无法启动的数据恢复案例
MongoDB数据库数据恢复环境: 一台Windows Server操作系统虚拟机上部署MongoDB数据库。 MongoDB数据库故障: 管理员在未关闭MongoDB服务的情况下拷贝数据库文件。将MongoDB数据库文件拷贝到其他分区后,对MongoDB数据库所在原分区进行了格式化操作。格式化完成后将数据库文件拷回原分区,并重新启动MongoDB服务。发现服务无法启动并报错。
|
存储 NoSQL MongoDB
数据库数据恢复—MongoDB数据库迁移过程中丢失文件的数据恢复案例
某单位一台MongoDB数据库由于业务需求进行了数据迁移,数据库迁移后提示:“Windows无法启动MongoDB服务(位于 本地计算机 上)错误1067:进程意外终止。”
|
存储 NoSQL MongoDB
微服务——MongoDB常用命令1——数据库操作
本节介绍了 MongoDB 中数据库的选择、创建与删除操作。使用 `use 数据库名称` 可选择或创建数据库,若数据库不存在则自动创建。通过 `show dbs` 或 `show databases` 查看所有可访问的数据库,用 `db` 命令查看当前数据库。注意,集合仅在插入数据后才会真正创建。数据库命名需遵循 UTF-8 格式,避免特殊字符,长度不超过 64 字节,且部分名称如 `admin`、`local` 和 `config` 为系统保留。删除数据库可通过 `db.dropDatabase()` 实现,主要用于移除已持久化的数据库。
813 0

推荐镜像

更多