漫谈事务与分布式事务(4)- 最终一致性

简介: 在上一篇文章里忽略了一点。   CAP 定理有一个缺陷,这个缺陷可以帮助我们“部分”摆脱 分布式困境。   总的来说,CAP 定理本身是完备的,但它并没有描述一个分布式系统何时产生分区,以及分区会持续多长时间。
在上一篇文章里忽略了一点。
 
CAP 定理有一个缺陷,这个缺陷可以帮助我们“部分”摆脱  分布式困境
 
总的来说,CAP 定理本身是完备的,但它并没有描述一个分布式系统何时产生分区,以及分区会持续多长时间。理论其实只限制:在分区发生的 时间内,系统只能在一致性(C)和可用性(A)之间二选一。
 
因此,分布式系统完全可以在没有出现分区时保证 C 和 A,而在出现分区后,放弃一些 A 或者 C 然后通过人工操作消除分区,让系统恢复到分区前的状况。
 
这样说太复杂了。用  人话 的方式就是:
 
    ※ 当没有故障时,系统正常处理请求并且返回一致的结果。
    ※ 出现故障后,首先把所有请求切换到正常机器,故障机器下线。
    ※ 接着人工恢复故障机器上的数据,保证数据一致性。
    ※ 最后让机器重新上线,恢复系统正常容量。
 
基本上(请忽略一些细节),这就是主备同步的数据库集群在故障恢复时的做法。
 
这里的思路是,既然 CAP 特性在一个时间点不可能同时满足,那我们可以在这个时间点暂时放弃 A 或者 C,然后在另一个时间点再设法恢复。只要恢复的速度足够快,用户就能够忍受暂时的不一致或者不可用。
 
“Twitter 只是暂时不可用,最终会恢复可用。”
 
沿着这个思路,业界产生了一些理论,其中最著名的是 BASE。
 
BASE, 最终一致性
 
这个理论由  Basically  Available,  Soft state,  Eventual consistency 组成。核心的概念是 Eventual consistency ——最终一致性。它局部的放弃了 CAP 理论中的“完全”一致性,提供了更好的可用性和分区容忍度。
 
     Basically Available
 
    基本可用, 或者说部分可用。由于分布式系统的节点故障是常见的,业务必须接受这种不可用,并且做出选择:是访问另一个节点忍受数据的临时不一致,还是等待节点恢复并忍受业务上的部分不可用。
 
     Soft state
 
    把所有节点的数据 (数据 = 状态) 都看作是缓存(Cache)。适当的调整业务,使业务可以忍受数据的临时不一致,并保证这种不一致是无害的,可以被最终用户理解。
 
     Eventual consistency
 
    放弃在任何时刻、从任何节点都能读到完全一致的数据。允许数据的临时不一致,并通过异步复制、重试和合并消除数据的临时不一致。
 
注意 在分布式系统中,写入和读取可能发生在不同的节点上。最终一致带来的问题是,业务在写入后立即读取,很可能读不到刚刚写入的数据。因此需要一个附加约束:
 
    RYW ( Read-Your-Writesconsistency
 
    RYW consistency 是弱化的因果一致性(Causal consistency),它保证业务在会话中一定能读到上一次写入的数据。会话可以看作是同一个连接,或者是同一个 HTTP Session。例如:用户刚刚创建了一个订单,在提交后他可以立刻查看这个订单,这就是 RYW 一致性。
 
ACID 与 BASE
 
BASE 这个缩写有些拼凑的痕迹。那是因为作者认为它的含义与 ACID 恰好相反。
 
在英文词典里,ACID 代表  (Acid),而 BASE 代表  (Base)。就像这两个单词在化学中的含义一样 —— ACID 与 BASE 位于 CAP 理论的两端,代表了分布式系统的两种选择。
 
传统数据库用 ACID 保护业务数据的一致性。它明确的要求:事务必须保证数据从上一个一致性状态进入下一个一致性状态,事务的结束和数据的一致性之间没有时差。
 
从 CAP 定理我们可以知道:正是 ACID 要求的这种“ ”一致性,使得事务系统只能选择 C-A 或者 C-P。第一个选择实际上是单机的传统数据库,第二个选择是后面将要介绍的强一致性的数据复制集群。
 
而 BASE 代表了另一种选择: 放弃一致性 来保证分布式系统的高可用。与 ACID 的做法相反:业务需要接受和处理数据的不一致,并且保证这些不一致不会破坏业务约束 —— 这需要设计者对可能产生的数据不一致和业务约束非常了解,并且带来了更高的复杂度。
 
选择  高可用 的价值在于:很多场景下系统不可用就意味着对外停止服务,对用户的影响和商业风险远远比“系统仍然可用但是要过一会才能看到数据”来得严重。在一些场景下,用户或许根本不在乎过一会才能看到数据,例如  银行跨行转账。但是,如果银行告诉用户无法进行跨行转账,那么就会有很多用户质疑或投诉银行的服务了。
 
上面的 CAP 拼图里还剩下一个区域。前面讨论过的 ACID 理论占据了 C-A 区域,代表根本无法容忍分区的传统单机数据库。本文介绍的 BASE 理论位于 A-P 区域,代表部分放弃一致性、追求高可用的现代业务系统。
 
因此在这幅拼图里还剩下 C-P:能够在分布式环境下  保证数据一致性 的理论。
 
下一篇准备介绍这一部分理论。敬请期待。

 

目录
相关文章
|
SQL 关系型数据库 MySQL
乐观锁在分布式数据库中如何与事务隔离级别结合使用
乐观锁在分布式数据库中如何与事务隔离级别结合使用
309 5
|
8月前
|
数据采集 监控 NoSQL
优化分布式采集的数据同步:一致性、去重与冲突解决的那些坑与招
本文讲述了作者在房地产数据采集项目中遇到的分布式数据同步问题,通过实施一致性、去重和冲突解决的“三板斧”策略,成功解决了数据重复和同步延迟问题,提高了系统稳定性。核心在于时间戳哈希保证一致性,URL归一化和布隆过滤器确保去重,分布式锁解决写入冲突。
466 2
 优化分布式采集的数据同步:一致性、去重与冲突解决的那些坑与招
|
8月前
|
消息中间件 运维 监控
《聊聊分布式》BASE理论 分布式系统可用性与一致性的工程平衡艺术
BASE理论是对CAP定理中可用性与分区容错性的实践延伸,通过“基本可用、软状态、最终一致性”三大核心,解决分布式系统中ACID模型的性能瓶颈。它以业务为导向,在保证系统高可用的同时,合理放宽强一致性要求,并借助补偿机制、消息队列等技术实现数据最终一致,广泛应用于电商、社交、外卖等大规模互联网场景。
|
监控 算法 关系型数据库
分布式事务难题终结:Seata+DRDS全局事务一致性架构设计
在分布式系统中,CAP定理限制了可用性、一致性与分区容错的三者兼得,尤其在网络分区时需做出取舍。为应对这一挑战,最终一致性方案成为常见选择。以电商订单系统为例,微服务化后,原本的本地事务演变为跨数据库的分布式事务,暴露出全局锁失效、事务边界模糊及协议差异等问题。本文深入探讨了基于 Seata 与 DRDS 的分布式事务解决方案,涵盖 AT 模式实践、分片策略优化、典型问题处理、性能调优及高级特性实现,结合实际业务场景提供可落地的技术路径与架构设计原则。通过压测验证,该方案在事务延迟、TPS 及失败率等方面均取得显著优化效果。
618 61
|
SQL 关系型数据库 MySQL
乐观锁在分布式数据库中如何与事务隔离级别结合使用
乐观锁在分布式数据库中如何与事务隔离级别结合使用
|
消息中间件 架构师 数据库
本地消息表事务:10Wqps 高并发分布式事务的 终极方案,大厂架构师的 必备方案
45岁资深架构师尼恩分享了一篇关于分布式事务的文章,详细解析了如何在10Wqps高并发场景下实现分布式事务。文章从传统单体架构到微服务架构下分布式事务的需求背景出发,介绍了Seata这一开源分布式事务解决方案及其AT和TCC两种模式。随后,文章深入探讨了经典ebay本地消息表方案,以及如何使用RocketMQ消息队列替代数据库表来提高性能和可靠性。尼恩还分享了如何结合延迟消息进行事务数据的定时对账,确保最终一致性。最后,尼恩强调了高端面试中需要准备“高大上”的答案,并提供了多个技术领域的深度学习资料,帮助读者提升技术水平,顺利通过面试。
本地消息表事务:10Wqps 高并发分布式事务的 终极方案,大厂架构师的 必备方案
|
存储 缓存 负载均衡
一致性哈希:解决分布式难题的神奇密钥
一致哈希是一种特殊的哈希算法,用于分布式系统中实现数据的高效、均衡分布。它通过将节点和数据映射到一个虚拟环上,确保在节点增减时只需重定位少量数据,从而提供良好的负载均衡、高扩展性和容错性。相比传统取模方法,一致性哈希能显著减少数据迁移成本,广泛应用于分布式缓存、存储、数据库及微服务架构中,有效提升系统的稳定性和性能。
857 1
|
监控
Saga模式在分布式系统中保证事务的隔离性
Saga模式在分布式系统中保证事务的隔离性
390 4
Saga模式在分布式系统中如何保证事务的隔离性
Saga模式在分布式系统中如何保证事务的隔离性
438 7
|
消息中间件 缓存 算法
分布式系列第一弹:分布式一致性!
分布式系列第一弹:分布式一致性!
540 0