NUMA与英特尔下一代Xeon处理器学习心得(7)

简介:
下面介绍 NUMA策略的实现方式和策略
在最新的通用操作系统, Windowslinux上, 都不同程度的提供了面向NUMA架构的系统控制和API支持。下面以linux为例,对该类接口进行说明。
 
Linux下的NUMA API
 
版本为2.5之后的linux内核在进程调度,内存管理等方面对NUMA系统做了大量优化。同时,基于2.6内核版本的各主要linux发行版,如RedhatSUSE等均包括了面向用户空间的numautils工具包,提供对NUMA系统内存策略的监控功能,并开放面向用户空间程序的API接口。该接口习惯上称为NUMA API
 
NUMA API主要任务是管理NUMA的内存策略。NUMA策略通过几个子系统的协同工作来实现。内核管理进程的内存分配机制以及特殊的内存映射。NUMA API通过新引入的3个内核系统调用来实现这一点。在用户空间中,NUMA API通过libnuma库提供了统一的接口供用户空间程序使用。相对于系统调用,libnuma接口更加清晰易用。同时NUMA API还提供了命令行工具numactlnumastat来帮助系统管理员实现进程级别的策略管理。
 
LinuxNUMA API支持四种内存分配策略:
 
  1. 缺省(default) -  总是在本地节点分配(分配在当前线程运行的节点上)
  2. 绑定(bind) -  分配到指定节点上
  3. 交织(interleave) -  在所有节点或者指定的节点上交织分配
  4. 优先(preferred) -  在指定节点上分配,失败则在其他节点上分配
 
绑定和优先的区别是,在指定节点上分配失败时(如无足够内存),绑定策略会报告分配失败,而优先策略会尝试在其他节点上进行分配。强制使用绑定有可能会导致前期的内存短缺,并引起大量换页。在libnuma库中,优先和绑定是组合在一起的。通过对线程调用uma_set_strict函数,可以在两种策略间切换。缺省的策略是更加普适的优先策略。
 
策略可以基于进程或内存区域设定。进程策略对整个进程内的内存分配都有效,而内存区域策略作用于指定的内存区域,其优先级比进程策略要高。
 
进程策略   作用于所有由内核分配的内存页,包括malloc, 系统调用中使用的内核级的分配以及文件缓冲区等。唯一的例外是,中断中分配的内存总是在当前节点中。当子进程Fork时,会继承父进程的进程策略。
 
内存区域策略   又称为VMA策略,它允许一个进程为自己地址空间里的一块内存设置策略。内存区域策略比进程策略具有更高的优先级。它的主要优点在于能够在分配发生前进行设置。目前,内存区策略只支持一部分内存机制,如:SYSV共享内存,shmemtmpfs文件映射,以及hugetlbfs文件系统。在共享内存段或文件映射被删除前,共享内存的区域策略会一直有效。
Linux 系统提供命令行及编程 API 两级用户空间工具来对策略进行控制。

本文转自Intel_ISN 51CTO博客,原文链接:http://blog.51cto.com/intelisn/130461,如需转载请自行联系原作者
相关文章
|
存储 边缘计算 固态存储
玄铁RISC-V处理器入门与实战-平头哥玄铁CPU IP-面向高性能领域CPU
玄铁RISC-V处理器入门与实战-平头哥玄铁CPU IP-
1562 1
|
人工智能 安全 大数据
第三代英特尔®至强®可扩展处理器:“X”王者归来
X是什么?每个人心中或许有不同的答案。 在数学方面,X代表着未知数;在坐标系统中常用来标识横坐标变量;在罗马数字里,Ⅹ代表十。当然还有一些时候,X表示无限,还有“目标”和“希望”的含义。 如果在计算领域,X也代表了x86架构,如今所有主流的计算机平台都基于x86架构而存在,这个X也不得不让我们想起x86架构的缔造者:英特尔。 提到英特尔,就无法不想到数据中心和服务器芯片市场,X是Xeon的首字母,英特尔®至强®可扩展处理器,为一大批互联网及企业级用户的数据中心带来了强劲的算力,也成就了英特尔在数据中心市场的霸主地位。
307 0
第三代英特尔®至强®可扩展处理器:“X”王者归来
|
芯片 Windows
ARM、英特尔、AMD 的处理器路线之争
ARM、英特尔、AMD都将笔记本电脑视为计算未来的关键,但它们采取了不同的方法。
1491 0