6 VPP源码分析 (VPP中的多线程)

简介:

VPP支持多线程模式,其中区分为main线程和worker线程,这两种线程都运行vlib_main_or_worker_loop函数作为线程主函数,主要区别在于执行时的is_main参数。
主线程可以调度执行所有类型的node,工作线程只能调度 VLIB_NODE_TYPE_INTERNAL和VLIB_NODE_TYPE_INPUT类型的结点。
在设置工作线程的时候,工作线程数最好和网卡的收包队列数保持一致。

6.1 多线程架构

所有的VLIB_NODE_TYPE_PROCESS结点登记的任务均被处理为使用jmp机制的协程。
而worker线程由pthread_create新建是传统意义上的线程模型,每个worker线程都被绑定到相应的核上。

VPP进程
├── main线程
│      ├── process协程1
│      ├── process协程2
│      └── process协程3
├── worker线程1    
└── worker线程2

具体的工作线程初始化操作由
static clib_error_t *start_workers(vlib_main_t *vm)函数负责
每个线程都有自己的线程堆栈vlib_thread_stacks,mheap,vlib_main_t,nodes,frames,next_frames,pengding frame等数据结构。

6.2. 线程间同步

VPP多线程之间同步采用的是类似于带信号和超时机制的自旋锁,主要有check、sync、release操作。
总体上类似于pthread_cond_timedwait中的互斥体改成自旋锁所提供的功能,超过BARRIER_SYNC_TIMEOUT时间的话说明可能发生死锁故直接abort。
其中:
vlib_worker_thread_barrier_check类似于pthread_cond_wait操作,等待vlib_worker_threads->wait_at_barrier条件。
vlib_worker_thread_barrier_sync类似于spin_lock操作,置位vlib_worker_threads->workers_at_barrier。
vlib_worker_thread_barrier_release类似于spin_unlock操作,复位vlib_worker_threads->workers_at_barrier。

6.2.1. vlib_worker_thread_barrier_check

vlib_main_or_worker_loop函数在开始时会调用vlib_worker_thread_barrier_check函数用以检查线程间的同步情况。
vlib_main_or_worker_loop代码片段:

while (1) {
    vlib_node_runtime_t *n;

if (!is_main) {
    vlib_worker_thread_barrier_check();
        vec_foreach(fqm, tm->frame_queue_mains)
        vlib_frame_queue_dequeue (vm, fqm);
    }

如果某个线程申请访问临界区那么本worker线程暂时不去处理数据,自旋等待。

vlib_worker_thread_barrier_check代码片段:

if (PREDICT_FALSE(*vlib_worker_threads->wait_at_barrier)) {             // 某个线程申请访问临界区
    clib_smp_atomic_add(vlib_worker_threads->workers_at_barrier, 1);    // 本线程将进入自旋状态,登记workers_at_barrier

    while (*vlib_worker_threads->wait_at_barrier)                            // 本线程进入自旋状态
        ;

    clib_smp_atomic_add (vlib_worker_threads->workers_at_barrier, -1);    // 本线程将退出自旋状态,取消登记workers_at_barrier

4.2.2. vlib_worker_thread_barrier_sync

count = vec_len(vlib_mains) - 1;                 // 这里count数等于vlib_mains的vector长度 - 1 ,也就是worker线程总数 - 1
deadline = vlib_time_now(vm) + BARRIER_SYNC_TIMEOUT;

*vlib_worker_threads->wait_at_barrier = 1;    //    本线程获得锁,所以将该条件变量标志置为1
while (*vlib_worker_threads->workers_at_barrier != count) {
    // 自旋等待其他线程(在其他核上)将变量vlib_worker_threads->workers_at_barrier设为count
// 当count等于workers_at_barrier时,其他的worker线程均处于自旋状态,也就是其他线程被锁住操作,本线程可以开始访问临界区

    if (vlib_time_now(vm) > deadline) {
      fformat(stderr, "%s: worker thread deadlock\n", __FUNCTION__);
      os_panic();
    }
}

4.2.3. vlib_worker_thread_barrier_release

deadline = now + BARRIER_SYNC_TIMEOUT;

*vlib_worker_threads->wait_at_barrier = 0;    //    本线程释放锁,所以将该条件变量标志置为0
while (*vlib_worker_threads->workers_at_barrier > 0) {
    // 自旋等待其他线程(在其他核上)将变量vlib_worker_threads->workers_at_barrier设为0
// 当count等于0时,其他的worker线程均处于工作状态,所有线程均退出临界区

    if ((now = vlib_time_now (vm)) > deadline) {
        fformat (stderr, "%s: worker thread deadlock\n", __FUNCTION__);
        os_panic ();
    }
}
目录
相关文章
|
20天前
|
存储 NoSQL Redis
Redis 新版本引入多线程的利弊分析
【10月更文挑战第16天】Redis 新版本引入多线程是一个具有挑战性和机遇的改变。虽然多线程带来了一些潜在的问题和挑战,但也为 Redis 提供了进一步提升性能和扩展能力的可能性。在实际应用中,我们需要根据具体的需求和场景,综合评估多线程的利弊,谨慎地选择和使用 Redis 的新版本。同时,Redis 开发者也需要不断努力,优化和完善多线程机制,以提供更加稳定、高效和可靠的 Redis 服务。
29 1
|
1月前
线程CPU异常定位分析
【10月更文挑战第3天】 开发过程中会出现一些CPU异常升高的问题,想要定位到具体的位置就需要一系列的分析,记录一些分析手段。
56 0
|
5月前
|
存储 SQL 监控
JAVA 线程池的分析和使用
JAVA 线程池的分析和使用
40 0
|
6月前
|
SQL Dubbo Java
案例分析|线程池相关故障梳理&总结
本文作者梳理和分享了线程池类的故障,分别从故障视角和技术视角两个角度来分析总结,故障视角可以看到现象和教训,而技术视角可以透过现象看到本质更进一步可以看看如何避免。
84760 136
案例分析|线程池相关故障梳理&总结
|
2月前
|
并行计算 API 调度
探索Python中的并发编程:线程与进程的对比分析
【9月更文挑战第21天】本文深入探讨了Python中并发编程的核心概念,通过直观的代码示例和清晰的逻辑推理,引导读者理解线程与进程在解决并发问题时的不同应用场景。我们将从基础理论出发,逐步过渡到实际案例分析,旨在揭示Python并发模型的内在机制,并比较它们在执行效率、资源占用和适用场景方面的差异。文章不仅适合初学者构建并发编程的基础认识,同时也为有经验的开发者提供深度思考的视角。
|
3月前
|
存储 监控 Java
|
3月前
|
安全 Java 开发者
Swing 的线程安全分析
【8月更文挑战第22天】
58 4
|
3月前
|
Java 数据库连接 数据库
当线程中发生异常时的情况分析
【8月更文挑战第22天】
96 4
|
3月前
|
安全 Java 程序员
线程安全与 Vector 类的分析
【8月更文挑战第22天】
43 4
|
3月前
|
存储 缓存 安全
深度剖析Java HashMap:源码分析、线程安全与最佳实践
深度剖析Java HashMap:源码分析、线程安全与最佳实践