强势解析eBay BASE模式、去哪儿及蘑菇街分布式架构

本文涉及的产品
云解析 DNS,旗舰版 1个月
云解析DNS,个人版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:

互联网行业是大势所趋,从招聘工资水平即可看出,那么如何提升自我技能,满足互联网行业技能要求?需要以目标为导向,进行技能提升,本文主要针对高并发分布式系统设计、架构(数据一致性)做了分析,祝各位早日走上属于自己的”成金之路”。

目录:

  • 问题分析
  • 概念解读
  • Most Simple原理解读
  • eBey、去哪儿、蘑菇街分布式事务案例分析
  • 参考资料

1.问题解析

要想做架构,必须识别出问题,即是谁的问题,什么问题。

明显的,分布式架构解决的是高并发的问题,高并发下服务高可用和数据一致性问题问题;当规模规模较小时,单库HA即可满足请求,当业务规模持续增加,单库已经无法满足业务需求,业界主流做法,是对业务进行分表、分库,那么原来的有些业务,现在则要在一个事务中,保证两个库同时操作成功或操作不成功(一个库成功,一个库失败,要么重新尝试失败库操作直到成功,要么回滚成功库)。随之而来的问题既是如何保证分库时业务操作的数据一致性。理解高并发分布式架构、分布式系统数据一致性的问题、起源是第一步。

这里多啰嗦一点,分库后,每个库可以采取不同的语言,以时下很流行的微服务向外提供服务;但是业务量不大的情况下,使用微服务到增加了复杂性及技术成本。明白技术的起源,针对不同的业务量,采取适当的架构、以最恰当的方式承载业务,是架构师必须具备的能力。

2.常见概念解读:

a.关系型数据库通常具有ACID特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。

b.Base(basically available, soft state, eventually consistent):一种 Acid 的替代方案,BASE 的可用性是通过支持局部故障而不是系统全局故障来实现的。化学理论中ACID是酸、Base恰好是碱。

c.CAP定律:在分布式系统中,同时满足”CAP定律”中的”一致性”、”可用性”和”分区容错性”三者是不可能的。

分布式架构

d.强一致:当更新操作完成之后,任何多个后续进程或者线程的访问都会返回最新的更新过的值。这种是对用户最友好的,就是用户上一次写什么,下一次就保证能读到什么。根据 CAP 理论,这种实现需要牺牲可用性,常见的RDBMS。

e.弱一致性:系统并不保证续进程或者线程的访问都会返回最新的更新过的值。系统在数据写入成功之后,不承诺立即可以读到最新写入的值,也不会具体的承诺多久之后可以读到。

f.最终一致性:弱一致性的特定形式。系统保证在没有后续更新的前提下,系统最终返回上一次更新操作的值。在没有故障发生的前提下,不一致窗口的时间主要受通信延迟,系统负载和复制副本的个数影响。DNS 是一个典型的最终一致性系统。

为保证可用性,互联网分布式架构将强一致性需求转换成最终一致性的需求,并通过系统执行幂等性的保证,保证数据的最终一致性。

※幂等性(Idempotence):分布式架构的基石,即同一个操作无论请求多少次,其结果都相同。

典型的是HTTP,Methods can also have the property of “idempotence” in that (aside from error or expiration issues) the side-effects of N > 0 identical requests is the same as for a single request.

每个概念实际所解决的是人遇到的某个特定的问题,发现其背后所代表的问题,是理解高并发分布式架构、分布式系统数据一致性第二步。

3.Most Simple原理解读

假设有一个从账户取钱的远程API(可以是HTTP的,也可以不是),我们暂时用类函数的方式记为:

bool withdraw(account_id, amount)

withdraw的语义是从account_id对应的账户中扣除amount数额的钱;如果扣除成功则返回true,账户余额减少amount;如果扣除失败则返回false,账户余额不变。

值得注意的是:和本地环境相比,我们不能轻易假设环境的可靠性。

一种典型的场景是withdraw请求已经被服务器端正确处理,但服务器端的返回结果由于网络等原因被掉丢了,导致客户端无法得知处理结果。如果是在网页上,一些不恰当的设计可能会使用户认为上一次操作失败了,然后刷新页面,这就导致了withdraw被调用两次,账户也被多扣了一次钱。如图1所示:

分布式架构

一种更轻量级的解决方案是幂等设计。我们可以通过一些技巧把withdraw变成幂等的,比如:

int create_ticket()

bool idempotent_withdraw(ticket_id, account_id, amount)

create_ticket的语义是获取一个服务器端生成的唯一的处理号ticket_id,它将用于标识后续的操作。idempotent_withdraw和withdraw的区别在于关联了一个ticket_id,一个ticket_id表示的操作至多只会被处理一次,每次调用都将返回第一次调用时的处理结果。这样,idempotent_withdraw就符合幂等性了,客户端就可以放心地多次调用。

基于幂等性的解决方案中一个完整的取钱流程被分解成了两个步骤:1.调用create_ticket()获取ticket_id;2.调用idempotent_withdraw(ticket_id, account_id, amount)。虽然create_ticket不是幂等的,但在这种设计下,它对系统状态的影响可以忽略,加上idempotent_withdraw是幂等的,所以任何一步由于网络等原因失败或超时,客户端都可以重试,直到获得结果。如图所示:

分布式架构

和分布式事务相比,幂等设计的优势在于它的轻量级,容易适应异构环境,以及性能和可用性方面。在某些性能要求比较高的应用,幂等设计往往是唯一的选择。

幂等性是高并发分布式架构、分布式系统数据一致性的底层基本原理,理解这一步,是走上”成金之路”的关键。

4.案例分析

a.eBay经典的BASE模式

一个最常见的场景,如果产生了一笔交易,需要在交易表增加记录,同时还要修改用户表的金额。这两个表属于不同的库及远程服务,所以就涉及到分布式事务一致性的问题。

核心思想是用两个事务来保证一致性,同时用异步保证了可用性:一个事务处理主要操作”增加交易表记录”与异步消息构建,另外一个事务用来处理构建的异步消息;第一个事务即处理主要业务又记录次要业务,同时还能快速返回,保证了高可用性,第二个事务则用来保证数据的一致性。(即将buyer和seller表更新的处理转为”线下”处理,消息日志可以存储到本地文本、数据库或消息队列,再通过业务规则自动或人工发起重试。人工重试更多的是应用于支付场景,通过对账系统对事后问题的处理,类似与淘宝双11重复支付后续退款)

一个经典的解决方法,将主要修改操作以及更新用户表的”异步消息”放在一个本地事务来完成。同时为了达到多次重试的幂等性,避免重复消费用户表消息带来的问题,增加一个更新记录表 updates_applied 来记录已经处理过的消息。

在第一事务中,通过本地的数据库的事务保障,保证”增加交易表记录”、”增加两条异步消息队列记录(一条处理buyer表、一条处理seller表)”,同时成功或同时失败。

在第二事务中,分别读出消息队列(但不删除),通过判断更新记录表 updates_applied 来检测相关消息是否被执行,如没执行,则执行相关业务逻辑(保证幂等性,保证即使执行过程中异常,重复执行没有任何问题),执行完所有消息后然后增加一条操作记录到updates_applied,事务到此结束。用事务保证两个异步消息执行及updates_applied的一致性操作(又称为分布式事务框架)。最后删除队列。

b.去哪儿网分布式事务方案

i.优先使用异步方案,原理和”a.eBay经典的BASE模式”类似,对业务逻辑处理不能保证”幂等性”的,增加去重表(即a中的updates_applied) 来处理

ii.对于不适合异步消息处理的业务,如A、B、C三方需要同步处理才能返回:在A、B、C三个库中分别维护一个事务记录表recorda/recordb/recordc,当A、B、C业务事务处理完,将结果存到对应的recordx中,由一个中心服务对比查询三方的事物记录表,有如下两种处理方式:

第一种:A、B成功,C失败了,重试C,知道C成功;

第二种:C不可能成功时,回滚A、B,如C为扣库存,当库存为0时,则不能成功(不考虑补库存)。

另,这种recordx表由RPC框架层进行维护,对业务是透明的。

c.蘑菇街交易创建过程

场景:将下单功能拆分为12个子业务(见参考资料b),对于非实时、非强一致性的关联业务,使用”eBay经典的BASE模式”思想,第一个本地事务执行成功后,以发消息通知、关联事务异步化执行方案,来避免a中第二个事务的”分布式事务框架”对业务带来的侵入和复杂性,具体方案是基于DB事件变化通知给MQ,而MQ消费者通过ACK,保证消息一定消费成功,完成强一致性(消息可能会被重发,所以消息消费方要保证幂等性)。

而对要求同步做、强一致性要求的场景(和b的ii相同场景),如优惠券和优惠券减库存:可以引入”a.eBay经典的BASE模式”的第二个事务(分布式事务框架)来处理,但是复杂性会急剧上升;

另一种方式是创建一个不可见订单,然后在同步调用锁券和扣减库存时,针对调用异常(失败或者超时),发出废单消息到MQ。如果消息发送失败,本地会做时间阶梯式的异步重试;优惠券系统和库存系统收到消息后,会进行判断是否需要做业务回滚,这样就准实时地保证了多个本地事务的最终一致性。

根据业务进行不同的方案处理,解决了高并发分布式架构、分布式系统的数据一致性问题。

分布式架构

整体来说,蘑菇街的案例可迁移性强,可移植性好,可以尝试模拟下实际场景,驾驭分布式架构、分布式系统数据一致性方案,祝大家早日走上”成金之路”,看到这里,烦请不吝”推荐”,谢谢!


本文作者:大象会跳舞

来源:51CTO

相关文章
|
1天前
|
负载均衡 监控 Cloud Native
探索微服务架构中的API网关模式
在微服务架构中,API网关扮演着至关重要的角色。它作为系统的单一入口点,不仅负责请求的路由、负载均衡和服务集成,还提供安全认证、监控和限流等关键功能。本文将深入探讨API网关的设计原则、实现策略及其在微服务生态系统中的作用,同时分析其在现代云原生应用中的实际运用案例。
|
2天前
|
负载均衡 监控 安全
探索微服务架构中的API网关模式
在微服务的大潮中,API网关扮演着至关重要的角色。它不仅是客户端与各个微服务之间的桥梁,更是性能优化、安全加固和协议转换的关键节点。本文将深入探讨API网关的核心概念,分析其在微服务架构中的重要性,并结合实例展示如何有效设计和管理API网关,以及如何通过网关解决跨域资源共享(CORS)和认证授权的挑战。
|
2天前
|
缓存 监控 负载均衡
探索微服务架构中的API网关模式
在微服务架构的海洋中,API网关如同一座灯塔,指引着服务间的通信。本文将深入探讨API网关的设计哲学、关键功能以及在实际应用中的考量因素。通过对比分析,我们将揭示API网关如何在提高系统可维护性、增强安全性和优化性能方面发挥其不可或缺的作用。此外,文章还将提供实践指南,帮助读者在构建或改进微服务架构时,做出明智的API网关选择和部署决策。
|
2天前
|
监控 安全 前端开发
探索微服务架构中的API网关模式
【7月更文挑战第23天】在云原生时代,微服务架构已成为构建可扩展、灵活且容错的系统的标准方法。然而,随着服务的增多,如何有效地管理跨服务通信成为了一个挑战。API网关模式应运而生,作为微服务生态系统中的关键组件,它负责请求的路由、转发、过滤和加工处理。本文将从API网关的定义出发,深入探讨其在微服务架构中的应用,以及如何实现高效的服务治理。我们将通过实例分析来揭示API网关设计的最佳实践,并讨论其对系统性能、安全性和可维护性的影响。
|
3天前
|
弹性计算 负载均衡 监控
探索微服务架构下的API网关模式
在现代的分布式系统中,微服务架构已经成为了主流。随着服务的不断增多,如何高效地管理这些服务之间的通信成为了一个关键问题。本文将深入探讨API网关模式,一种有效的解决方案,它能够提供请求路由、负载均衡、认证授权和监控等功能。我们将通过对比分析、案例研究以及数据统计来展示API网关模式的优势,并讨论其在实际部署中的最佳实践和可能面临的挑战。
21 5
|
4天前
|
负载均衡 监控 API
探索微服务架构中的API网关模式
随着微服务架构在软件开发领域的兴起,API网关作为系统的关键组件之一,承担着请求路由、负载均衡、认证授权等重要职责。本文将深入探讨API网关的设计原则、实现技术及其在微服务架构中的作用,旨在为读者提供一套完整的理解和实践API网关的框架。 【7月更文挑战第21天】
13 0
|
5天前
|
监控 负载均衡 安全
微服务架构下的服务发现与注册:技术深度解析
【7月更文挑战第20天】服务发现与注册是微服务架构中不可或缺的一部分,它确保了服务间的动态发现和通信。通过选择合适的实现工具和遵循最佳实践,可以构建出高效、可靠、可扩展的微服务系统。随着技术的不断进步,未来我们还将看到更多创新的服务发现与注册解决方案的出现。
|
7天前
|
负载均衡 安全 API
探索微服务架构中的API网关模式
【7月更文挑战第18天】在微服务架构中,API网关不仅是流量的守门人,更是服务的协调者。本文将深入探讨API网关的核心作用、设计原则以及实现策略,揭示其在微服务生态系统中不可或缺的地位。通过案例分析,我们将一窥API网关如何优雅地处理服务发现、负载均衡、认证授权等关键任务,同时确保系统的弹性和安全性。
|
8天前
|
负载均衡 安全 API
探索微服务架构中的API网关模式
在微服务架构的海洋中,API网关犹如一座灯塔,为迷失方向的请求指引道路。本文将深入探讨API网关的设计哲学、核心功能及其在系统架构中的关键作用。我们将从流量控制、安全防护到服务聚合等多个维度剖析API网关的重要性,并结合实例分析其在实际项目中的运用。
|
8天前
|
监控 Kubernetes 安全
Istio整体架构解析
【7月更文挑战第17天】Istio整体架构分为数据平面(Data Plane)和控制平面(Control Plane)两部分

推荐镜像

更多