程序绑定 CPU 核心

简介: 程序绑定 CPU 核心

有时候需要将程序绑定到固定 CPU 的某个核心上运行。

我们知道多核 CPU 系统中,进程和线程的运行在哪个核心是由操作系统内核根据一定的调度算法进行调度的。但是实际软件开发过程中,我们出于一些目的,想要进程或者线程稳定运行在某个 CPU 核心上。比如我想测试两种算法的性能,因为服务器上有一些其他的进程干扰,测试的时间总是有波动,此时就需要将测试程序稳定在某个核心上测试。

Linux 中有 CPU 亲和性这种说法(Windows 有没有我不知道,也不关心)。引用一下维基百科的说法:

CPU 亲和性就是绑定某一进程(或线程)到特定的 CPU(或 CPU 集合),从而使得该进程(或线程)只能运行在绑定的 CPU(或 CPU 集合)上。CPU 亲和性利用了这样一个事实:进程上一次运行后的残余信息会保留在 CPU 的状态中(也就是指 CPU 的缓存)。如果下一次仍然将该进程调度到同一个 CPU 上,就能避免缓存未命中等对 CPU 处理性能不利的情况,从而使得进程的运行更加高效。

Linux 系统中每个进程的 task_struct 结构中有一个 cpus_allowed 位掩码,该掩码的位数与系统CPU 核数相同(若 CPU 启用了超线程则为核数乘以 2),通过修改该位掩码可以控制进程可运行在哪些特定 CPU 上。Linux 系统为我们提供了 CPU 亲和性相关的调用函数和一些操作的宏定义。

Linux 提供了一些宏定义来修改掩码,如 CPU_ZERO() (将位掩码全部设置为 0)和CPU_SET()(设置特定掩码位为 1)。CPU 的亲合力掩码用一个 cpu_set_t 结构体来表示一个 CPU 集合,下面的几个宏分别对这个掩码集进行操作:

  • CPU_ZERO():清空一个集合。
  • CPU_SET()CPU_CLR() 分别对将一个给定的 CPU 号加到一个集合或者从一个集合中去掉。
  • CPU_ISSET() 检查一个 CPU 号是否在这个集合中。

然后还有两个接口帮助我们绑定进程到某个 CPU 或者 CPU 集合上。

  • sched_setaffinity(pid_t pid, unsigned int cpusetsize, cpu_set_t *mask)
  • 该函数设置进程pid 的这个进程,让它运行在 mask 所设定的 CPU 上。如果 pid 的值为 0,则表示指定的是当前进程,使当前进程运行在 mask 所设定的那些 CPU 上。第二个参数 cpusetsize 是 mask 所指定的数的长度。通常设定为 sizeof(cpu_set_t)。如果当前 pid 所指定的进程此时没有运行在 mask 所指定的任意一个 CPU 上,则该指定的进程会从其它 CPU 上迁移到 mask 的指定的一个 CPU 上运行。
  • sched_getaffinity(pid_t pid, unsigned int cpusetsize, cpu_set_t *mask)
  • 该函数获得 pid 所指示的进程的 CPU 位掩码,并将该掩码返回到 mask 所指向的结构中。即获得指定 pid 当前可以运行在哪些 CPU 上。同样,如果 pid 值为0,也表示的是当前进程。

因此,一个简易常见的将当前进程绑定到 CPU 某个核心(比如 6,CPU ID 从 0 开始)的示例如下:


cpu_set_t mask;
cpu_set_t get;
CPU_ZERO(&mask);
int cpu_id = 6;
CPU_SET(cpu_id, &mask);
if (sched_setaffinity(0, sizeof(mask), &mask) == -1)
{
    std::cout << "WARNING: Could not set CPU Affinity, continuing。。。" << std::endl;
}
else
{
    std::cout << "Bind process to cpu id: " << cpu_id << std::endl;
}


Linux 还提供了线程绑定核心的接口:


int threadBindCPU(std::thread &thread, int cpuID)
{
    unsigned num_cpus = std::thread::hardware_concurrency();
    std::cout << "Launching " << num_cpus << " threads\n";
    cpu_set_t mask;
    CPU_ZERO(&mask);
    CPU_SET(cpuID, &mask);
    int rc = pthread_setaffinity_np(thread.native_handle(), sizeof(cpu_set_t), &mask);
    if (rc != 0)
    {
        std::cerr << "Error calling pthread_setaffinity_np: " << rc << "\n";
    }
    std::cout << "thread id: " << std::hash<std::thread::id>{}(thread.get_id()) << ", cpu id: " << cpuID << std::endl;
}


查看某个线程绑定的 CPU 核心,需要在线程内部调用:

sched_getcpu()

目录
相关文章
|
5月前
|
C++
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
54 0
|
7月前
|
缓存 C语言 计算机视觉
程序与技术分享:CPU0处理器的架构及应用
程序与技术分享:CPU0处理器的架构及应用
|
6月前
|
存储 缓存 NoSQL
Redis性能优化问题之优化 Redis fork 耗时严重的问题,如何解决
Redis性能优化问题之优化 Redis fork 耗时严重的问题,如何解决
|
6月前
|
NoSQL Redis
Redis性能优化问题之查看 Redis 进程是否发生内存 swap,如何解决
Redis性能优化问题之查看 Redis 进程是否发生内存 swap,如何解决
|
6月前
|
缓存 弹性计算 数据库
阿里云2核4G服务器支持多少人在线?程序效率、并发数、内存CPU性能、公网带宽多因素
2核4G云服务器支持的在线人数取决于多种因素:应用效率、并发数、内存、CPU、带宽、数据库性能、缓存策略、CDN和OSS使用,以及用户行为和系统优化。阿里云的ECS u1实例2核4G配置,适合轻量级应用,实际并发量需结合具体业务测试。
104 0
阿里云2核4G服务器支持多少人在线?程序效率、并发数、内存CPU性能、公网带宽多因素
|
8月前
|
Linux 调度
linux中进程与cpu核的绑定
linux中进程与cpu核的绑定
246 0
|
8月前
|
NoSQL
【线程绑定cpu核心】
【线程绑定cpu核心】
|
C++ 索引 Windows
调试实战——程序CPU占用率飙升,你知道如何快速定位吗?
程序CPU占用率飙升,你知道如何快速定位吗?
|
1月前
|
存储 缓存 监控
Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
本文介绍了Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
102 7
|
2月前
|
弹性计算 Kubernetes Perl
k8s 设置pod 的cpu 和内存
在 Kubernetes (k8s) 中,设置 Pod 的 CPU 和内存资源限制和请求是非常重要的,因为这有助于确保集群资源的合理分配和有效利用。你可以通过定义 Pod 的 `resources` 字段来设置这些限制。 以下是一个示例 YAML 文件,展示了如何为一个 Pod 设置 CPU 和内存资源请求(requests)和限制(limits): ```yaml apiVersion: v1 kind: Pod metadata: name: example-pod spec: containers: - name: example-container image:
270 1