背景

"时间"是我们平时思考问题时用到的一个基本概念，"时间"来源于一个更加基础的概念"事件发生顺序"。通常，如果事件发生在时钟显示为3:15之后并且尚未变为3:16, 我们会称这个事件发生在3:15。通过时间来为事件排序在系统中随处可见。比如在航线预定系统中，我们规定"如果一条航线尚未被预定，那么它应该被分配给接下来的航线预定请求"。需要注意的是，在分布式系统中我们需要对于事件的顺序进行重新的认识。

分布式系统由一组空间上相互独立、彼此间通过信息交换进行交互的进程组成。通过网络连接的一组计算机，是一个分布式系统。一台计算机也可以看做是由cpu、memory、disk等组成的分布式系统。因此，一般我们认为系统的不同进程间通信延迟相比进程内部通信延迟不可忽略时，那么这个系统就被认为是分布式系统。

我们关注的重点会聚焦在由多台计算机组成的分布式系统，但是其中的许多理论是普遍适用的。尤其，对于虽然运行在一台计算机上的多进程系统，由于事件发生的不确定性，其所面临的问题与多台计算机组成的的分布式系统是相似的。

在分布式系统中，有时候很难明确的说两个事件的发生顺序, 因此"happened before"只是系统中某些事件间的一个"偏序关系"(这里的概念是相对于系统中所有事件的按照时间排序的全序关系而言)。其实很多问题的发生都是因为认为没有认识到这种关系的本质和影响。

本文，我们会讨论由"happened before"关系所定义的"偏序关系"，并且会提出一种分布式算法来将这种某些事件间的"偏序关系"扩展为所有事件间的"全序关系"。这个分布式算法可以很好的帮助实现一个分布式系统，我们会通过解决一个同步问题，来说明它的用法。需要指出的是，如果通过该算法获得的事件顺序与用户所认为的顺序不同，可能会引起一些异常行为，我们会通过引入真实的物理时钟来避免这个问题。我们会提供一个简单的方式用于系统中不同时钟间的同步，并且会明确这些时钟间的最大偏差。

偏序关系

大部分人认为如果事件A的发生时间早于事件B，那么事件A "happened before" 事件B。他们是根据理论上的物理时间得出这个顺序的。但是，如果系统要正确的得到某种特定的事件顺序，那么这个事件顺序必须是系统观察到的。如果这种顺序是根据物理时钟定义的，那么系统中必须包含一个真实的时钟。问题在于，即使系统真的包含一个物理时钟，但是这样的时钟并不是完美的精确，并且不能跟真实的物理时间完全一致(时钟的误差,导致观察到的"时间"有误差，那么基于这种时钟的"时间"定义的顺序就有问题)。因此，我们并不依赖物理时钟去定义"偏序关系"。

接下来，我们开始准确的描述我们的系统。假设我们的系统由一组进程组成，每个进程包含一系列"事件"。"事件"的定义由应用程序决定，比如计算机上的一个子程序执行可以认为是一个"事件"，一个机器指令的执行也可以认为是一个"事件"(不同应用场景对于事件的定义不同，比如在数据库中一次dml可以认为是一个事件)。假设在一个进程中所有事件组成的序列中，如果事件A"happened before"事件B，那么事件A在事件B之前发生。换句话说，一个进程中事件有天然的全序关系，对于一个进程来说这种关系看起来顺理成章。当然我们也可以将我们的定义从进程扩展到子进程，但是我们并不打算这样去做。

假设进程中发送和接收消息是一个事件，那么可以这样定义"happened before"关系(通过"->"符号表示)：

定义：系统中事件间的"->"关系是满足以下三个条件的最基本关系)：1）如果事件A和事件B发生于同一个进程，并且事件A先于事件B，那么A->B;2)如果事件A是某一个进程的发送消息事件，事件B是对应的另外一个进程接收消息事件，那么A->B; 3) 如果A->B并且B->C,那么A->C(传递性)。如果A!->B并且B!->A(也就是事件A、B之间没有偏序关系)，那么认为事件A和事件B是并发的。

对于任意事件A，A!->A(在系统中一个事件可以"happened before"它自身，看起来是没有实际意义的)。这也表明"->"是一个系统中所有事件集合中的一个"反自反偏序关系"。(离散数学中的关系，自反和反自反)

类似Figure 1中的"时空图"，对于理解上述定义是有帮助的。时空图中，横向表示空间，纵向表示时间(越高表示时间越靠后)，小圆点表示事件，纵向的线表示进程，波浪线表示消息。显而易见，A->B表示在时空图中可以沿着表示进程的线或表示消息的波浪线，从A移动到B。比如Figure 1中的p1->r4。

时空图1.jpg

另外一种理解上述定义的方式是，A->B意味着事件A和事件B之间可能存在因果关系。如果两个事件之间相互无影响，那么它们是并发的。比如Figure 1中的p3和q3是并发的，即使图中所画的q3先于p3发生，但是进程P无法知道进程Q中q3事件直到在p4事件中收到来自进程Q的消息。(在时间p4之前，进程P最多知道进程Q计划做事件q3)。

如果熟悉狭义相对论中的时空观，那么可以比较自然的理解上述定义。在狭义相对论中，时间的顺序是根据可能被发送的消息定义的。在我们的定义中，我们更加实用的只考虑实际发送的消息。我们根据实际发生的事件去判断系统是否正常工作，而不是根据可能发生的事件去判断。

分布式系统基本概念--逻辑时钟

背景

偏序关系

逻辑时钟

全序关系

异常行为

物理时钟

总结

参考

关系型数据库

热门文章

最新文章

相关课程

相关电子书