《并行计算的编程模型》一2.6.5 MCS Locks示例

简介: 本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.6.5节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.6.5 MCS Locks示例

本节是最后一个示例,该示例展示了将部分的共享存储器算法转换到基于分布式存储器的AM实现的过程。该算法要解决的是MCS锁的锁获取函数[189]。本节只提供锁获取部分,我们鼓励读者自己进行初始化与锁释放操作。另外强烈建议读者阅读MCS锁相关论文,尤其是2.4节的算法5。理解共享内存实现机制对于学习该示例非常重要。
转换为C的MCS锁数据类型和共享内存的锁获取函数如代码清单2-6所示。
screenshot
在代码清单2-6中:
(1)lock数据类型为共享内存的链表头。
(2)qnode数据类型构成了链表的数据元素。
(3)qnode数据类型中包括一个locked字段,允许阻塞在锁获取时的线程在本地内存中轮询。
本例的主要目标是在分布式内存实现中重构这些属性,为此我们从数据类型的转换开始入手。如代码清单2-7所示。
screenshot
代码的第11~14行定义了两个“宽指针”类型,其中每个包括一个节点和一个地址。在lock_t和qnode_t类型的定义中,指向链表节点的指针已经替换为等价的“宽”指针。这是从共享内存到分布式内存转换中常用的术语。这两种类型的定义还包括“NEW”标识的字段,接下来将介绍其使用方法。
在进一步介绍MCS锁获取的转换前,我们向读者做一个简短的说明。本例是第一个必须让指针作为AM参数传递的示例。正如前文所述,GASNet AM的参数是无符号的32位整数。那么在传递64位指针的时候要作为两个参数。如果只考虑64位平台,那么可以使用简单的C预处理器宏实现这些。然而,同时为32位和64位平台编写易读的代码就需要使用C语言处理器实现。每个使用GASNet的客户端都有多个习惯用语版本,代码清单2-8提供了构建示例所需的三个AM处理程序的使用逻辑。在列表的宏定义中,采用双括号的参数列表Request2P和Reply2P1I不是很常见,其目的是确保C的预处理器能够以正确顺序执行其扩展。
screenshot
screenshot
我们再次回到代码清单2-6的共享内存C代码中,且重点关注第12行和第16行代码。这两行代码虽然只包含了原始算法中对非本地存储器的引用,但它们在AM中的实现构成了本例的核心内容,如代码清单2-9所示。
screenshot
当上一个值返回且相对于进行相同更新的其他线程执行原子性操作时,共享内存代码fetch_and_store()函数替换了调用者I的链表头。分布式存储器的这个操作由AM请求处理程序FetchAndStoreRequest及其相应的回复处理程序FetchAndStoreReply实现。通过GASNet处理程序安全锁满足原子性要求。在锁保护的临界区内,宽指针已有的值将保存在prev中并写入新值。因为节点部分(至少对于此算法)始终是请求的发送方,因此处理程序参数可以只传递新值的地址部分,节点部分可以通过gasnet_GetMsgSource获得。最后,FetchAndStoreRequest发送包含prev值(其中的节点部分为显式内容,因为可能是任何节点)的回复。
AM回复处理程序FetchAndStoreReply负责接收FetchAndStoreRequest请求应用程序发回的值。其中参数还包括在原始请求中传递的Ptr2值。这就允许回复处理程序识别相应的请求,并将“Fetched”值存储在正确的qnode_t变量的predecessor字段中。这种请求者上的地址来回传递在构造基于AM算法中十分常见,就像接收“return value”的预留空间一样(如添加在qnode_t类型的predecessor字段)。后续将在检查AcquireLock代码时解释gasnett_local_wmb()的调用。
代码清单2-9中的第三个AM处理程序是StoreNextRequest,主要用于实现共享内存版本算法的“predecessor->next = I”操作。这与FetchAndStoreReply函数十分相似,两者的区别在于写入的字段和节点数是以隐式形式传递的而不是参数形式,且StoreNextRequest处理程序不必进行回复。
最后,我们将和读者一起参考代码清单2-10实现AcquireLock。
screenshot
该部分代码遵循与带加法的共享存储器算法相同的步骤顺序。首先将调用者I初始化空的链表,且设置predecessor为“nil”。然后调用fetch-and-store的AM版本,并调用GASNET BLOCKUNTIL等待函数直至predecessor值不为“nil”。下一步是划分predecessor-> addr值,这里体现了GASNet工具gasnett_local_wmb()的重要性。该函数实现内存栅栏以确保在写入node字段前,对addr字段的写入是全局可见的。结合GASNET BLOCKUNTIL中对应的读取栅栏,此栅栏确保我们读取(node,addr)对的一致性,而无需互斥操作。
在对predecessor-> addr的值进行划分过程中,分布式存储器算法通过标记I为“locked”、将I的地址写入predecessor的next字段以及设置待清除的I->lock标记的方式,继续遵循共享存储器版本的逻辑操作。其中上述标记的清除操作是在尚未提供的LockRelease代码中完成的,同时我们也鼓励读者自己动手构建LockRelease以达到练习所学知识的目的。

相关文章
|
并行计算
《并行计算的编程模型》一2.6.4 AM Ring示例
本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.6.4节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
985 0
|
并行计算
《并行计算的编程模型》一3.6.2 fence和quiet:RMA操作排序
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.6.2节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1145 0
|
并行计算 算法
《并行计算的编程模型》一2.3.4 锁与中断
本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.3.4节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1117 0
|
并行计算
《并行计算的编程模型》一3.6.4 wait和wait_until
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.6.4节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1046 0
|
并行计算 程序员
《并行计算的编程模型》一3.6.3 锁
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.6.3节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
933 0
|
并行计算
《并行计算的编程模型》一3.8 原子内存操作
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.8节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
969 0
|
并行计算 API
《并行计算的编程模型》一3.4.1 初始化和查询
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.4.1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1072 0
|
并行计算
《并行计算的编程模型》一2.2.2 线程
本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.2.2节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
897 0
|
并行计算 程序员
《并行计算的编程模型》一3.6 排序和同步
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.6节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
943 0