内核抢占实现(preempt) 【转】

简介:

转自:http://blog.chinaunix.net/uid-12461657-id-3353217.html

一、什么叫抢占
所谓抢占,说白了就是进程切换。
linux的用户空间,进程A在执行中,来(硬?)中断打断A,从中断处理程序返回时,如果有更高优先级进程B在排队的话,那么执行进程B。 用户空间下进程总是可抢占的


在linux的内核空间就不一定了,linux 2.4是不可抢占的,实时性就会降低,如下面这个样子:


二、抢占的API

preempt_enable()  开启抢占
preempt_disable() 禁止抢占

内核中每个进程数据结构里有一个计数器preempt_count
抢占的开启与禁止,操作当前进程的preempt_count
内核在进行进程调度的时候,只要prempt_count为0,内核就可以进行抢占。
    struct thread_info {
        struct task_struct *task; /* main task structure */
        ............//省略
        int     cpu;              /* cpu we're on */
        int     preempt_count;    /* 0 => preemptable,  <0 => BUG */
    };

    #define preempt_enable() \
    do { \
        preempt_enable_no_resched(); \
        barrier(); \
        preempt_check_resched(); \
    } while (0)

    #define preempt_disable() \
    do { \
        inc_preempt_count(); \
        barrier(); \
    } while (0)

    #define preempt_enable_no_resched() \
    do { \
        barrier(); \
        dec_preempt_count(); \
    } while (0)

    #define inc_preempt_count() add_preempt_count(1)
    #define dec_preempt_count() sub_preempt_count(1)
    #define add_preempt_count(val) do { preempt_count() += (val); } while (0)
    #define sub_preempt_count(val) do { preempt_count() -= (val); } while (0)
    #define preempt_count() (current_thread_info()->preempt_count)

三、发生抢占的时机
linux进程调度的核心函数是 schedule(),进程调度就是在这里做的。
schedule的调用分为主动调用和被动调用。
主动调用是指内核显示的直接去调用shedule(),如当前进程调用了可休眠函数,里面会调用schedule
被动调用是指在系统调用、中断处理或异常处理结束之后,由相应的回调函数调用schedule
判断完当前进程是否可抢占,才会接着去调用schedule()

只看了看中断返回时schedule被动调用的情况
至于主动调用的地方就太多了,什么进程结束,pause等等,没耐心看了。。。

3.1 从中断返回时

首先是从中断处理程序do_IRQ()返回后,会调用ret_from_except() (看《PowerPC中断相关知识》)
ret_from_except()里要先check一下,判定前面被中断的执行体是运行在用户空间还是内核空间,
在决定返回到用户空间或内核空间

用户空间的话:(现在知道为什么用户空间程序总是可抢占了吧) 
ret_from_except 
   --> user_exc_return 
        --> do_work 
          --> 调用 do_signal 和 schedule

内核空间的话:(编译内核时要打开可抢占选项才行)
ret_form_except 
    --> resume_kernel 
        --> preempt_schedule_irq 
          --> schedule

.globl ret_from_except
ret_from_except:
LOAD_MSR_KERNEL(r10,MSR_KERNEL)  //将MSR_KERNEL常量设置到MSR,以禁止外部中断
SYNC                             //Some chip revs have problems here...
MTMSRD(r10)                      //disable interrupts

lwz r3,_MSR(r1)                  //读栈中的MSR[PR],Returning to user mode?
andi. r0,r3,MSR_PR
beq resume_kernel

user_exc_return:                   //r10 contains MSR_KERNEL here
rlwinm r9,r1,0,0,(31-THREAD_SHIFT) //Check current_thread_info()->flags
lwz r9,TI_FLAGS(r9)
andi. r0,r9,(_TIF_SIGPENDING|_TIF_RESTORE_SIGMASK|_TIF_NEED_RESCHED)
bne do_work
restore_user:

#ifdef CONFIG_PREEMPT
b restore

resume_kernel:
rlwinm r9,r1,0,0,(31-THREAD_SHIFT) /* check current_thread_info->preempt_count */
lwz r0,TI_PREEMPT(r9)
cmpwi 0,r0,0                       /* if non-zero, just restore regs and return */
bne restore
lwz r0,TI_FLAGS(r9)
andi. r0,r0,_TIF_NEED_RESCHED
beq+ restore
andi. r0,r3,MSR_EE                /* interrupts off? */
beq restore                       /* don't schedule if so */
1: bl preempt_schedule_irq
rlwinm r9,r1,0,0,(31-THREAD_SHIFT)
lwz r3,TI_FLAGS(r9)
andi. r0,r3,_TIF_NEED_RESCHED
bne- 1b
#else
resume_kernel:
#endif /* CONFIG_PREEMPT */
////////////////////////////////////////////////////////////////////////////////////
do_work:            /* r10 contains MSR_KERNEL here */
    andi.   r0,r9,_TIF_NEED_RESCHED
    beq do_user_signal

do_resched:         /* r10 contains MSR_KERNEL here */
    ori r10,r10,MSR_EE
    SYNC
    MTMSRD(r10)     /* hard-enable interrupts */
    bl  schedule
recheck:
    LOAD_MSR_KERNEL(r10,MSR_KERNEL)
    SYNC
    MTMSRD(r10)     /* disable interrupts */
    rlwinm  r9,r1,0,0,(31-THREAD_SHIFT)
    lwz r9,TI_FLAGS(r9)
    andi.   r0,r9,_TIF_NEED_RESCHED
    bne-    do_reschedandi.   r0,r9,_TIF_SIGPENDING
    beq restore_user
do_user_signal:         /* r10 contains MSR_KERNEL here */


asmlinkage void __sched preempt_schedule_irq(void){
    struct thread_info *ti = current_thread_info();
    BUG_ON(ti->preempt_count || !irqs_disabled());
    do {
        add_preempt_count(PREEMPT_ACTIVE);
        local_irq_enable();
        schedule();
        local_irq_disable();
        sub_preempt_count(PREEMPT_ACTIVE);
        barrier();
    } while (unlikely(test_thread_flag(TIF_NEED_RESCHED)));
}

asmlinkage void __sched preempt_schedule(void){
    struct thread_info *ti = current_thread_info();
    //preempt_cout非0的话,就不调用schedule
    if (likely(ti->preempt_count || irqs_disabled()))
        return;

    do {
        add_preempt_count(PREEMPT_ACTIVE);
        schedule();
        sub_preempt_count(PREEMPT_ACTIVE);
        barrier();
    } while (unlikely(test_thread_flag(TIF_NEED_RESCHED)));
}
#########################################################################################;
 内核中的执行路径主要有:
 1  用户进程的内核态,此时有进程context,主要是代表进程在执行系统调用等。
    还包括,内核中自己的进程,如 ksoftirqd 等等
 2  中断或者异常或者自陷等,从概念上说,此时没有进程context,不能进行context switch。
 3  bottom_half,从概念上说,此时也没有进程context。
 4  同时,相同的执行路径还可能在其他的CPU上运行。

Linux2.6中网络代码中的preempt_enable/disable移到softirqd调用的地方原因是这样的.
一、部分softirq是isr处理之后调用的,
    对于这部分代码,由于是在底半处理中运行,必须是是在运行进程系统调用之前返回的.
    所以实际上preempt_disable(); preempt_enable();代码对于他们来说是没有意义的.
二、部分softirq是在ksoftirqd的内核线程运行的,
    因为这个相当于运行在进程的内核空间,由于软中断都是对中断上半部的继续,
    所以这些工作都需要尽快的完成.所以在softirqd运行的时候,禁止了preempt,
    这样就可以保证softirq运行完之后才会调度下一个进程,因为softirq里面的所有函数都不会睡眠.










本文转自张昺华-sky博客园博客,原文链接:http://www.cnblogs.com/sky-heaven/p/5391887.html,如需转载请自行联系原作者

相关文章
|
缓存 负载均衡 Linux
内核:进程与调度机制(笔记)
内核:进程与调度机制(笔记)
269 0
|
9月前
|
存储 人工智能 算法
加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统 | 2024龙蜥大会主论坛
本次方案的主题是加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统,从产业洞察、创新实践、发展建议三个方面,指出 AI 原生应用对操作系统提出更高要求,需要以应用为导向、以系统为核心进行架构创新设计,要打造最 AI 的服务器操作系统。 1. 产业洞察 2. 创新实践 3. 发展建议
264 6
|
安全 算法 网络安全
IPsec VPN简介
IPsec VPN简介
839 6
|
11月前
|
缓存 Linux 开发者
Linux内核中的并发控制机制
本文深入探讨了Linux操作系统中用于管理多线程和进程的并发控制的关键技术,包括原子操作、锁机制、自旋锁、互斥量以及信号量。通过详细分析这些技术的原理和应用,旨在为读者提供一个关于如何有效利用Linux内核提供的并发控制工具以优化系统性能和稳定性的综合视角。
238 11
|
算法 Linux 调度
Linux源码阅读笔记03-调度器及CFS调度器
Linux源码阅读笔记03-调度器及CFS调度器
|
NoSQL C语言
gdb调试常用命令
gdb调试常用命令
329 0
gdb调试常用命令
|
安全 数据安全/隐私保护 C++
C++一分钟之-成员访问控制:public, private, protected
【6月更文挑战第20天】C++的成员访问控制涉及`public`、`private`和`protected`,影响类成员的可见性和可访问性。`public`成员对外公开,用于接口;`private`成员仅限类内部,保护数据安全;`protected`成员在派生类中可访问。常见问题包括不恰当的访问级别选择、继承中的访问权限误解及过度使用友元。通过示例展示了如何在派生类中访问`protected`成员。正确使用访问修饰符能确保代码的封装性、安全性和可维护性。
573 4
|
存储 缓存 算法
双向链表的建立和使用场景
双向链表的建立和使用场景
|
消息中间件 Unix Linux
【ZMQ polling机制】ZMQ异步接收机制以及与epoll/select的对比分析
【ZMQ polling机制】ZMQ异步接收机制以及与epoll/select的对比分析
896 0