图-10中,三副本若有两个以上完成处理,写即可认为成功了。若三副本中只有一个完成写入,会怎样?到底几个副本完成才能认为写成功?
成功写操作,要求三副本的至少两个完成,即至多有一个副本可能包含旧值。因此,在读取时需至少向两个副本发起读请求,通过版本号可确定一定至少有一个包含新值。若第三个副本停机或响应慢,则读取仍可继续并返回最新值。
若有n副本,写入须w个节点确认,至少为每个读取查询r个节点。只要 w + r > n,我们期望在读取时获得最新值,因为r个读取中至少有一个节点最新。遵循这些r值,w值的读写称为法定人数(quorum)读写。也可认为r和w是判定读、写是否有效的最低票数。
Dynamo风格DB的参数n,w和r一般可配置。常见选择是n为奇数(3或5)并设置 w = r = ( n + 1 ) / 2 w = r =(n + 1)/ 2w=r=(n+1)/2(向上取整)。但可按需更改数字。如设置w = n w = nw=n和r = 1 r = 1r=1的写入很少且读取次数较多的工作负载可能会受益。这使得读取速度更快,但具有只有一个失败节点导致所有数据库写入失败的缺点。
集群中可能存在多于n的节点。(集群的机器数可能多于副本数目),但任何给定的值只能存储在n个节点上。这允许对数据集进行分区,从而可以支持比单个节点的存储能力更大的数据集。
仲裁条件w + r > n w + r> nw+r>n定义了系统可容忍的失效节点个数:
若w < n w <nw<n,若节点不可用,仍能处理写入
若r < n r <nr<n,若节点不可用,仍能处理读取
对于n = 3 , w = 2 , r = 2 n = 3,w = 2,r = 2n=3,w=2,r=2,可容忍一个不可用节点
对于n = 5 , w = 3 , r = 3 n = 5,w = 3,r = 3n=5,w=3,r=3,可容忍两个不可用的节点。 案例如图-11
通常,读、写操作始终并行发送到所有n个副本。 w、r决定我们等待多少个节点,即在我们认为读、写成功前,有多少个节点需报告成功。
若少于所需的w或r节点可用,则写入或读取将返回错误。节点不可用原因:因执行操作的错误(由于磁盘已满而无法写),因为节点关闭(崩溃,关闭电源),由于客户端和服务器节点之间的网络中断等。 只关心节点是否返回了成功响应,无需区分出错具体原因。