浅谈 CAP 理论

简介:

本文介绍了介绍了分布式系统著名的 CAP 理论。什么是 CAP 理论?为什么说 CAP 只能三选二?了解 CAP 对于系统架构又有什么指导意义?本文将一一作答。

什么是 CAP 理论

在计算机科学理论,CAP 定理(也称为 Brewer 定理),是由计算机科学家 Eric Brewer 提出的,即在分布式计算机系统不可能同时提供以下全部三个保证:

  • 一致性(Consistency):所有节点同一时间看到是相同的数据;
  • 可用性(Availability):不管是否成功,确保每一个请求都能接收到响应;
  • 分区容错性(Partition tolerance):系统任意分区后,在网络故障时,仍能操作

为什么说 CAP 只能三选二

下面分别举例说明了为什么说 CAP 只能三选二。

上面的图显示了在一个网络中,N1 和 N2 两个节点。他们都共享数据块 V,其中有一个值 V0 。运行在 N1 的 A 程序可以认为是安全的、无 bug、可预测的和可靠的。运行在 N2 是 B 程序。这个例子中,A 将写入 V 新​值,而 B 从 V 读取值

系统预期执行下面的操作

  1. 首先写一个 V 的新​值 V1
  2. 然后消息(M)从 N1 更新 V 的拷贝到 N2
  3. 现在,从 B 读取将返回 V1

如果网络是分区的,当 N1 到 N2 的消息不能传递时,执行上面的第三步,会出现虽然 N2 能访问到 V 的值(可用性),但其实与 N1 的 V 的值已经不一致了(一致性)。

CAP 常见模型

牺牲分区(CA 模型)

举例:

  • 单站点数据库
  • 集群数据库
  • LDAP
  • xFS 文件系统

实现方式:

  • 两阶段提交
  • 缓存验证协议

牺牲可用性(CP 模型)

举例:

  • 分布式数据库
  • 分布式锁定
  • 绝大部分协议

实现方式:

  • 悲观锁
  • 少数分区不可用

牺牲一致性(AP 模型)

举例:

  • Coda
  • Web 缓存
  • DNS

实现方式:

  • 到期/租赁
  • 解决冲突
  • 乐观

CAP 的意义

在系统架构时,应该根据具体的业务场景,来权衡 CAP。比如,对于大多数互联网应用来说(如门户网站),因为机器数量庞大,部署节点分散,网络故障是常态,可用性是必须需要保证的,所以只有舍弃一致性来保证服务的 AP。而对于银行等,需要确保一致性的场景,通常会权衡 CA 和 CP 模型,CA 模型网络故障时完全不可用,CP 模型具备部分可用性。

参考引用

目录
相关文章
|
4月前
简述CAP理论,BASE理论
简述CAP理论,BASE理论
22 0
|
19天前
|
Nacos
分布式理论:CAP理论 BASE理论
分布式理论:CAP理论 BASE理论
20 2
|
10月前
|
算法 关系型数据库 UED
|
10月前
什么是CAP理论?
什么是CAP理论?
84 0
|
10月前
|
Java 关系型数据库 大数据
简述 CAP 定理【重要】
简述 CAP 定理【重要】
50 0
|
11月前
分布式理论CAP定理
分布式理论CAP定理
|
11月前
|
消息中间件 缓存 负载均衡
分布式理论 - CAP
CAP理论是分布式系统理论中的重要理论之一,它指出在分布式系统中,一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三个要素不可能同时满足。CAP理论的核心思想是:在分布式系统中,当发生网络分区时,必须在一致性和可用性之间做出选择,从而保证分区容错性。具体来说,当发生网络分区时,系统必须要么保证所有节点的一致性,但会导致部分节点不可用,要么保证所有节点的可用性,但会导致节点之间的数据不一致。
275 0
分布式理论 - CAP
|
搜索推荐 NoSQL 关系型数据库
分布式CAP理论和BASE理论
对于分布式系统的项目,使用中没有强制要求一定是CAP中要达到某几种,具体根据各自业务场景所需来制定相应的策略而选择适合的产品服务等。例如:支付订单场景中,由于分布式本身就在数据一致性上面很难保证,从A服务到B服务的订单数据有可能由于服务宕机或其他原因而造成数据不一致性。因此此类场景会酌情考虑:AP,不强制保证数据一致性,但保证数据最终一致性。
156 0
分布式CAP理论和BASE理论
|
Go 数据库
对CAP理论的理解
对CAP理论的理解
129 0
对CAP理论的理解
|
分布式计算 Dubbo NoSQL