《并行计算的编程模型》一2.7 未来方向

简介: 本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.7节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.7 未来方向

在编写本书时,GASNet中两个主要的API块实现尚未发布在官方规范。然而,伯克利UPC运行时已经使用了上述API,而且将其写入规范中只是时间问题。
第一个API块主要是指非连续数据上的RMA操作接口,也称作“Vector,Indexed,Strided”或简称“VIS”。GASNet VIS接口描述作为文档[47]的一部分为UPC提供了类似接口,可在GASNet中的gasnet_vis.h头文件中查阅其函数原型。
第二个API块是GASNet Collectives,更详细的描述请查看docs/collective notes.txt文件,原型在gasnet_coll.h头文件中。
最后对核心与扩展API的使用进行了总结,并提出了一些有关未来发展的展望。
(1)针对本地完成带有“sync”的非阻塞AM操作。它能够消除Medium 负载的过度拷贝或重新拷贝需求,这些通常在客户端的临时缓冲器中生成,且相对LongAsync而言,发送至远程段的负载具有更高的可用性。
(2)“Immediate”非阻塞RMA操作。该操作在网络未就绪时接受附加任务将会返回失败信息。这将允许客户端能够在进行RMA操作前执行一些其他有用的工作,而不是像当前做法一样等到网络就绪后执行。
(3)具有以独立事件对非阻塞批量Put 操作进行本地完成同步的能力。目前尚不能确定非阻塞批量Put操作的本地完成是否独立于其远程完成。添加这样的机制将使临时缓冲区和存储器具有更好的可控性。

相关文章
|
机器学习/深度学习 人工智能 并行计算
深度学习设计的衍射处理器并行计算数百个变换
深度学习设计的衍射处理器并行计算数百个变换
深度学习设计的衍射处理器并行计算数百个变换
|
安全 算法 量子技术
简述量子计算相关的技术分类与可扩展方向(二)
简述量子计算相关的技术分类与可扩展方向
134 0
|
机器学习/深度学习 存储 算法
GNN落地不再难,一文总结高效GNN和可扩展图表示学习最新进展
GNN落地不再难,一文总结高效GNN和可扩展图表示学习最新进展
278 0
|
机器学习/深度学习 存储 算法
简述量子计算相关的技术分类与可扩展方向(一)
简述量子计算相关的技术分类与可扩展方向
171 0
|
机器学习/深度学习 算法 数据挖掘
机器学习特性缩放的介绍,什么时候为什么使用
机器学习特性缩放的介绍,什么时候为什么使用
168 0
机器学习特性缩放的介绍,什么时候为什么使用
|
并行计算 API
《并行计算的编程模型》一2.5.1 GASNet工具
本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.5.1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1009 1
|
并行计算
《并行计算的编程模型》一3.9 未来方向
本节书摘来华章计算机《并行计算的编程模型》一书中的第3章 ,第3.9节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
967 0
|
并行计算
《并行计算的编程模型》一1.11 总结
本节书摘来华章计算机《并行计算的编程模型》一书中的第1章 ,第1.11节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1048 0
|
并行计算
《并行计算的编程模型》一1.3 点对点通信
本节书摘来华章计算机《并行计算的编程模型》一书中的第1章 ,第1.3节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1337 0
|
并行计算 索引
《并行计算的编程模型》一2.3.1 开始和结束
本节书摘来华章计算机《并行计算的编程模型》一书中的第2章 ,第2.3.1节, [(美)帕万·巴拉吉(Pavan Balaji)编著;张云泉等译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1097 0
下一篇
无影云桌面