Linux进程信号(二)

简介: Linux进程信号

三、阻塞信号

3.1 相关概念认识

实际执行信号的处理动作,称为信号递达(Delivery)

信号从产生到递达之间的状态,称为信号未决(pending)

进程可以选择阻塞(Block)某个信号,被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作

阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后的一种处理动作

3.2 内核层理解

3b28d8af6112472b8d409326e745584c.png


在block位图中,bit位的位置代表某一个信号,biit位的内容代表该信号是否被阻塞

在pending位图中,bit位的位置代表某一个信号,bit位的内容代表是否收到该信号

handler表本质上是一个函数指针数组,数组的下标代表某一个信号,数组的内容代表该信号递达时的处理动作,处理动作包括默认、忽略以及自定义

block、pending和handler这三张表的每一个位置是一一对应的

每个信号都有两个标志位分别表示阻塞和未决,还有一个函数指针指向处理方法。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作(未产生则不会递达)

SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然其处理动作是忽略,但在没有递达前不能忽略这个信号,因为进程仍有机会在改变处理动作之后再解除阻塞

SIGQUIT信号未产生过,但一旦产生SIGQUIT信号,该信号将被阻塞,它的处理动作是用户自定义函数sighandler

若在进程解除对某信号的阻塞之前,这种信号产生过多次,POSIX.1允许系统递达该信号一次或多次。Linux是这样实现的:普通信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里(这里只讨论普通信号)

3.3 sigset_t

sigset_t被称为信号集,这个类型可以表示每个信号的"有效"或"无效"状态


在阻塞信号集中"有效"和"无效"的含义是该信号是否被阻塞。

在未决信号集中"有效"和"无效"的含义是该信号是否处于未决状态

阻塞信号集也被称为当前进程的信号屏蔽字,"屏蔽"应该理解为阻塞而不是忽略


3.4 信号集操作函数

sigset_t类型对于每种信号用一个bit位表示"有效"或"无效",至于这个类型内部如何存储这些bit则依赖于系统的实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_t变量,而不应该对它的内部数据做任何解释,比如用printf()直接打印sigset_t变量是没有意义的。


#include <signal.h>
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset(sigset_t *set, int signum);
int sigdelset(sigset_t *set, int signum);
int sigismember(const sigset_t *set, int signum);  

sigemptyset函数:初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号

sigfillset函数:初始化set所指向的信号集,使其中所有信号的对应bit置位,表示该信号集的有效信号包括系统支持的所有信号

sigaddset函数:在set所指向的信号集中添加某种有效信号

sigdelset函数:在set所指向的信号集中删除某种有效信号

sigemptyset、sigfillset、sigaddset和sigdelset函数都是成功返回0,出错返回-1

sigismember函数:判断在set所指向的信号集中是否包含某种信号,若包含则返回1,不包含则返回0,调用失败返回-1

注意:


在使用sigset_t类型的变量前,一定要调用sigemptyset()或sigfillset()初始化,使信号处于确定的状态

代码中定义的sigset_t类型的变量s存在栈区,使用上面的函数只会对变量s造成影响,并不会影响进程的任何行为。还需通过sigprocmask()函数,才能将变量s的数据设置进操作系统

3.5 sigprocmask && sigpending

3.5.1 sigprocmask

sigprocmask()函数可用于读取或更改进程的信号屏蔽字(阻塞信号集)


int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);

若oset是非空指针,则读取进程当前的信号屏蔽字通过oset参数传出

若set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改

若oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字

how选项:


e37758b9c25e47cb8a089de42fee5f23.png


返回值:sigprocmask函数调用成功返回0,出错返回-1


3.5.2 sigpending

sigpending()函数用于读取进程的未决信号集

int sigpending(sigset_t *set);

sigpending()函数读取当前进程的未决信号集,通过set参数传出。该函数调用成功返回0,出错返回-1


3.6 实验测试

步骤:


先用上述的函数将2号信号进行屏蔽(阻塞)。

使用kill命令或组合按键向进程发送2号信号。

此时2号信号会一直被阻塞,并一直处于pending(未决)状态。

使用sigpending函数获取当前进程的pending信号集进行验证

#include <iostream>
#include <unistd.h>
#include <signal.h>
using namespace std;
void PrintPending(sigset_t *pending)
{
  for (int i = 1; i <= 31; i++) {
    if (sigismember(pending, i)) cout << "1 ";
    else cout << "0 ";
  }
  cout << endl;
}
int main()
{
  sigset_t set, oset;
    sigset_t pending;
    //清空信号集
  sigemptyset(&set);
  sigemptyset(&oset);
    sigemptyset(&pending);
  sigaddset(&set, 2);//添加2号信号
  sigprocmask(SIG_SETMASK, &set, &oset);//将数据设置进内核,阻塞2号信号
  while (1) {
    sigpending(&pending); //获取pending
    PrintPending(&pending); //打印pending位图
    sleep(1);
  }
  return 0;
}

程序刚刚运行时,因为没有收到任何信号,所以此时该进程的pending表一直是全0。当使用kill命令向进程发送2号信号后,由于2号信号是阻塞的,所以2号信号一直处于未决状态,所以pending表中的第二个数字一直是1

1f0dd13cb98e48b7ba6ead9ec71ddddb.png



为了看到2号信号递达后pending表的变化,可以设置一段时间后解除2号信号的阻塞状态,但解除2号信号的阻塞后2号信号就会立即被递达。2号信号的默认处理动作是终止进程,所以为了看到2号信号递达后的pending表,可以将2号信号进行捕捉,让2号信号递达时执行自定义动作

#include <iostream>
#include <unistd.h>
#include <signal.h>
using namespace std;
void handler(int signum) {
  cout << "handler signo: " << signum << endl;
}
void PrintPending(sigset_t *pending)
{
  for (int i = 1; i <= 31; i++) {
    if (sigismember(pending, i)) cout << "1 ";
    else cout << "0 ";
  }
  cout << endl;
}
int main()
{
  signal(2, handler);
  sigset_t set, oset;
    sigset_t pending;
    //清空信号集
  sigemptyset(&set);
  sigemptyset(&oset);
    sigemptyset(&pending);
  sigaddset(&set, 2);//添加2号信号
  sigprocmask(SIG_SETMASK, &set, &oset);//将数据设置进内核,阻塞2号信号
  int count = 0;
  while (1) {
    sigpending(&pending); //获取pending
    PrintPending(&pending); //打印pending位图
    sleep(1);
    ++count;
    if(count == 20) { //恢复曾经的信号屏蔽字
      sigprocmask(SIG_SETMASK, &oset, NULL);
      cout << "恢复信号屏蔽字" << endl;
    }
  }
  return 0;
}

进程收到2号信号后,该信号在一段时间内处于未决状态,当解除2号信号的屏蔽后,2号信号就会立即递达,执行我们所给的自定义动作,而此时的pending表也变回了全0


227ba17a210a453d8613814560ef88ca.png


四、捕捉信号

4.1 内核空间与用户空间

每个进程都有自己的进程地址空间,该进程地址空间由内核空间和用户空间组成:


用户所写的代码和数据位于用户空间,通过用户级页表与物理内存之间建立映射关系

内核空间存储的实际上是操作系统代码和数据,通过内核级页表与物理内存之间建立映射关系

内核级页表是一个全局的页表,它用来维护操作系统的代码与进程之间的关系。在每个进程的进程地址空间中,用户空间是属于当前进程的,每个进程看到的代码和数据是完全不同的,但内核空间所存放的都是操作系统的代码和数据,所有进程看到的都是一样的内容

6b880f02966c448b94d0774af5a9baf9.png



虽然每个进程都能够看到操作系统,但并不意味着每个进程都能够随时对其进行访问.当访问用户空间时必须处于用户态,当访问内核空间时必须处于内核态


4.2 内核态与用户态

内核态通常用来执行操作系统的代码,是一种权限非常高的状态

用户态是一种用来执行普通用户代码的状态,是一种受监管的普通状态

进程收到信号之后,并不是立即处理信号,而是在合适的时候进行处理。"合适的时候"就是指,从内核态切换回用户态的时候


从用户态切换为内核态:


  1. 需要进行系统调用时
  2. 当前进程的时间片到了,导致进程切换
  3. 产生异常、中断、陷阱等

从内核态切换为用户态:


  1. 系统调用返回时
  2. 进程切换完毕
  3. 异常、中断、陷阱等处理完毕

由用户态切换为内核态被称之为陷入内核。每当需要陷入内核时,本质上是因为需要执行操作系统的代码。比如系统调用函数是由操作系统实现的,要进行系统调用就必须先由用户态切换为内核态


4.3 内核实现信号捕捉

当我们在执行主控制流程的时候,可能因为某些情况而陷入内核,当内核处理完毕准备返回用户态时,就需要进行信号pending的检查。(此时仍处于内核态,有权力查看当前进程的pending位图)


在查看pending位图时,若发现未决信号,且该信号没有被阻塞,那么此时就需要该信号进行处理。若待处理信号的处理动作是默认或者忽略,则执行该信号的处理动作后清除对应的pending标志位,若没有新的信号要递达,就直接返回用户态,从主控制流程中上次被中断的地方继续向下执行即可


但若待处理信号是自定义捕捉的(用户提供处理方法),那么处理该信号时就需要先返回用户态执行对应的自定义处理动作,执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位。若没有新的信号要递达,就直接返回用户态,继续执行主控制流程的代码

b5435c15f0b44af28bec9b9c2306e1b3.png



注意:sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。sighandler是内核线程调用的(内核线程服务于多个进程)


简化上图:


bc6377911e8744829a3e280b4faae1f5.png


该图形与直线有几个交点就代表在这期间有几次状态切换,而箭头的方向就代表着此次状态切换的方向,图形中间的圆点就代表着检查pending表。


当识别到信号的处理动作是自定义时,能直接在内核态执行用户空间的代码吗?


看似可以,因为内核态是一种权限非常高的状态,但是绝对不能这样设计。


若允许在内核态直接执行用户空间的代码,那么恶意用户就可以在代码中设计一些非法操作,比如清空数据库等,虽然在用户态时没有足够的权限清空数据库,但是在内核态时是有足够权限清空数据库的。即不能让操作系统直接去执行用户的代码,因为操作系统无法保证用户的代码是合法代码,即操作系统不信任用户


4.4 sigcation

捕捉信号除了使用signal()函数外,还可以使用sigaction()函数


int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);

sigaction()函数可以读取和修改与指定信号相关联的处理动作,该函数调用成功返回0,出错返回-1


signum代表指定信号的编号

若act指针非空,则根据act修改该信号的处理动作

若oldact指针非空,则通过oldact传出该信号原来的处理动作

struct sigaction {
  void(*sa_handler)(int);
  void(*sa_sigaction)(int, siginfo_t *, void *);
  sigset_t   sa_mask;
  int        sa_flags;
  void(*sa_restorer)(void);
};

sa_handler


将sa_handler赋值为SIG_IGN传给sigaction函数,表示忽略信号

将sa_handler赋值为SIG_DFL传给sigaction函数,表示执行系统默认动作

将sa_handler赋值为一个函数指针,表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数

注意: 所注册的信号处理函数的返回值为void,参数为int。通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。这是一个回调函数,但不是被main函数调用,而是被操作系统所调用

sa_sigaction

sa_sigaction是实时信号的处理函数

sa_mask

当某个信号的处理函数被调用,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,若这种信号再次产生,那么它会被阻塞到当前处理结束为止。

若在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时,会自动恢复成原来的信号屏蔽字。

sa_flags

sa_flags字段包含一些选项,这里直接将sa_flags设置为0即可

sa_restorer

暂时不使用该参数


五、SIGCHLD信号

为了避免出现僵尸进程,父进程需要使用wait或waitpid函数等待子进程结束,父进程可以阻塞等待子进程结束,也可以非阻塞地轮询是否有子进程结束等待清理。采用第一种方式,父进程阻塞时就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,且程序实现复杂。


其实,子进程在终止时操作系统会给父进程发生SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理动作,这样父进程就只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait或waitpid函数清理子进程即可。

#include <iostream>
#include <cstdlib>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>
using namespace std;
void handler(int signo)
{
  cout << "get a signal:" << signo << endl;
  int ret = 0;
  while ((ret = waitpid(-1, NULL, WNOHANG)) > 0) {
    cout << "wait child " << ret << " success" << endl;
  }
    exit(0);
}
int main()
{
  signal(SIGCHLD, handler);
  if (fork() == 0) {//child
    cout << "child is running, PID: " << getpid() << endl;
    exit(1);
  }
  //father
  while (1);
  return 0;
}

SIGCHLD属于普通信号,记录该信号的pending位只有一个,在同一时刻可能有多个子进程同时退出,那么使用waitpid()函数清理子进程时需要使用while不断进行清理

使用waitpid()函数时,需要设置WNOHANG选项,即非阻塞式等待。否则当所有子进程都已经清理完毕时,由于while循环,会再次调用waitpid函数,此时就会阻塞住

c2bfc2b308c24d6e9fcc066675663984.png


要想不产生僵尸进程还有另外一种办法:父进程调用signal或sigaction函数将SIGCHLD信号的处理动作设置为SIG_IGN,这样子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用signal或sigaction函数自定义的忽略通常是没有区别的,但这是一个特列。此方法对于Linux可用,但不保证在其他UNIX系统上都可用

#include <iostream>
#include <cstdlib>
#include <unistd.h>
#include <signal.h>
using namespace std;
int main()
{
  signal(SIGCHLD, SIG_IGN);
  if (fork() == 0) { //child
    cout << "child is running, PID: " << getpid() << endl;
    sleep(3);
    exit(1);
  }
  //father
  while (1);
  return 0;
}

d4a22b57eaf642e2bba1a5428b9850d8.png


六、可重入函数

若主函数中调用insert()函数向链表中插入结点node1,且某信号处理函数中也调用了insert函数向链表中插入结点node2,貌似并没有什么问题


1、首先,main函数中调用了insert函数,想将结点node1插入链表,但插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回到用户态之前检查到有信号待处理,于是切换到sighandler函数


68a614f1f6fc4a2fbc3c3559939352c7.png


2、而sighandler函数中也调用了insert函数,将结点node2插入到了链表中。当结点node2插入的两步操作都做完之后从sighandler返回内核态


7ef3487f23b44aa3aa7ad06f2a85f4fa.png


3、再次回到用户态就从main函数调用的insert函数中继续往下执行,即继续进行结点node1的插入操作


a821c87880cd4fe0ad328a5767e86726.png


最终结果是,main函数和sighandler函数先后向链表中插入了两个结点,但最后只有node1结点真正插入到了链表中,而node2结点就找不到了,造成了内存泄漏


如上例,insert函数被不同的控制流调用(main函数和sighandler函数使用不同的堆栈空间,它们之间不存在调用与被调用的关系,是两个独立的控制流程),有可能在第一次调用还没返回时就再次进入该函数,这种现象被称之为重入


insert函数访问一个全局链表,有可能因为重入而造成错乱,这样的函数被称之为不可重入函数;反之,若一个函数只访问自己的局部变量或参数,则称之为可重入函数


一个函数符合以下条件之一就一定是不可重入的:


  1. 调用了malloc或free,因为malloc也是用全局链表来管理堆的
  2. 调用了标准I/O库函数,因为标准I/O库的很多实现都以不可重入的方式使用全局数据结构

目录
相关文章
|
5月前
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
237 67
|
6月前
|
安全 Linux
【Linux】阻塞信号|信号原理
本教程从信号的基本概念入手,逐步讲解了阻塞信号的实现方法及其应用场景。通过对这些技术的掌握,您可以更好地控制进程在处理信号时的行为,确保应用程序在复杂的多任务环境中正常运行。
235 84
|
4月前
|
Web App开发 Linux 程序员
获取和理解Linux进程以及其PID的基础知识。
总的来说,理解Linux进程及其PID需要我们明白,进程就如同汽车,负责执行任务,而PID则是独特的车牌号,为我们提供了管理的便利。知道这个,我们就可以更好地理解和操作Linux系统,甚至通过对进程的有效管理,让系统运行得更加顺畅。
117 16
|
4月前
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
93 20
|
3月前
|
监控 Shell Linux
Linux进程控制(详细讲解)
进程等待是系统通过调用特定的接口(如waitwaitpid)来实现的。来进行对子进程状态检测与回收的功能。
75 0
|
3月前
|
存储 负载均衡 算法
Linux2.6内核进程调度队列
本篇文章是Linux进程系列中的最后一篇文章,本来是想放在上一篇文章的结尾的,但是想了想还是单独写一篇文章吧,虽然说这部分内容是比较难的,所有一般来说是简单的提及带过的,但是为了让大家对进程有更深的理解与认识,还是看了一些别人的文章,然后学习了学习,然后对此做了总结,尽可能详细的介绍明白。最后推荐一篇文章Linux的进程优先级 NI 和 PR - 简书。
102 0
|
3月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
66 0
|
3月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
68 0
|
6月前
|
Linux 数据库 Perl
【YashanDB 知识库】如何避免 yasdb 进程被 Linux OOM Killer 杀掉
本文来自YashanDB官网,探讨Linux系统中OOM Killer对数据库服务器的影响及解决方法。当内存接近耗尽时,OOM Killer会杀死占用最多内存的进程,这可能导致数据库主进程被误杀。为避免此问题,可采取两种方法:一是在OS层面关闭OOM Killer,通过修改`/etc/sysctl.conf`文件并重启生效;二是豁免数据库进程,由数据库实例用户借助`sudo`权限调整`oom_score_adj`值。这些措施有助于保护数据库进程免受系统内存管理机制的影响。
|
6月前
|
存储 Linux 调度
【Linux】进程概念和进程状态
本文详细介绍了Linux系统中进程的核心概念与管理机制。从进程的定义出发,阐述了其作为操作系统资源管理的基本单位的重要性,并深入解析了task_struct结构体的内容及其在进程管理中的作用。同时,文章讲解了进程的基本操作(如获取PID、查看进程信息等)、父进程与子进程的关系(重点分析fork函数)、以及进程的三种主要状态(运行、阻塞、挂起)。此外,还探讨了Linux特有的进程状态表示和孤儿进程的处理方式。通过学习这些内容,读者可以更好地理解Linux进程的运行原理并优化系统性能。
221 4