linux系统编程(十)守护进程、线程(上)

简介: linux系统编程(十)守护进程、线程

1.守护进程、线程


1.1 进程组和会话

1670992549696.jpg


1.1.1 概念和特性


进程组,也称之为作业。BSD于1980年前后向Unix中增加的一个新特性。代表一个或多个进程的集合。每个进程都属于一个进程组。在waitpid函数和kill函数的参数中都曾使用到。操作系统设计的进程组的概念,是为了简化对多个进程的管理。


当父进程,创建子进程的时候,默认子进程与父进程属于同一进程组。进程组ID等价于第一个进程ID(组长进程)。所以,组长进程标识:其进程组ID==其进程ID

可以使用kill -SIGKILL -进程组ID(负的)来将整个进程组内的进程全部杀死。


组长进程可以创建一个进程组,创建该进程组中的进程,然后终止。只要进程组中有一个进程存在,进程组就存在,与组长进程是否终止无关。


进程组生存期:进程组创建到最后一个进程离开(终止或转移到另一个进程组)。 一个进程可以为自己或子进程设置进程组ID


1.1.2 创建会话


创建一个会话需要注意以下6点注意事项:


1.进程组组长不能创建会话,非组长进程创建会话后变成新会话首进程(session header)

2.该进程成为一个新进程组的组长进程。

3.需有root权限 (ubuntu不需要)

4.新会话丢弃原有的控制终端,该会话没有控制终端

5.该调用进程是组长进程,则出错返回

6.建立新会话时,先调用fork, 父进程终止,子进程调用setsid


使用下面两个函数,建立新会话时,先调用fork, 父进程终止,子进程调用setsid
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(void){
  pid_t pid;
  if((pid = fork())<0){
  perror("fork");
  exit(1);
  }else if(pid == 0){
  printf("child process PID is %d\n",getpid());
  printf("Group ID of child is %d\n",getpgid(0));
  printf("Session ID of child is %d\n",getsid(0));
  sleep(10);
  setsid();
  printf("Changed:\n");
  printf("child process PID is %d\n",getpid());
  printf("Group ID of child is %d\n",getpgid(0));
  printf("Session ID of child is %d\n",getsid(0));    
  sleep(20);
  exit(0);
  }
  return 0;
}


1.1.3 getsid函数


获取进程所属的会话ID

pid_t getsid(pid_t pid); 
成功:返回调用进程的会话ID;
失败:-1,设置errno
pid为0表示察看当前进程session ID

命令查看系统中的进程

ps ajx
参数a表示不仅列当前用户的进程,也列出所有其他用户的进程
参数x表示不仅列有控制终端的进程,也列出所有无控制终端的进程
参数j表示列出与作业控制相关的信息。


组长进程不能成为新会话首进程,新会话首进程必定会成为组长进程。


1.1.4 setsid函数


创建一个会话,并以自己的ID设置进程组ID,同时也是新会话的ID。

pid_t setsid(void);  
成功:返回调用进程的会话ID;
失败:-1,设置errno


调用了setsid函数的进程,既是新的会长,也是新的组长。


1.2 守护进程


Daemon(精灵)进程,是Linux中的后台服务进程,通常独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。一般采用以d结尾的名字。


Linux后台的一些系统服务进程,没有控制终端,不能直接和用户交互。不受用户登录、注销的影响,一直在运行着,他们都是守护进程。如:预读入缓输出机制的实现;ftp服务器;nfs服务器等。

创建守护进程,最关键的一步是调用setsid函数创建一个新的Session,并成为Session Leader。


1.2.1 创建守护进程模型

1.创建子进程,父进程退出
所有工作在子进程中进行形式上脱离了控制终端
2.在子进程中创建新会话
    setsid()函数
    使子进程完全独立出来,脱离控制
3.改变当前目录为根目录
    chdir()函数
    防止占用可卸载的文件系统
    也可以换成其它路径
4.重设文件权限掩码
    umask()函数
    防止继承的文件创建屏蔽字拒绝某些权限
    增加守护进程灵活性
5.关闭文件描述符
    继承的打开文件不会用到,浪费系统资源,无法卸载
6.开始执行守护进程核心工作守护进程退出处理程序模型                                               
【mydaemond.c】
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <pthread.h>
#include <fcntl.h>
#include <sys/stat.h>
void sys_err(const char *str)
{
    perror(str);
    exit(1);
}
int main(int argc,char *argv[])
{
    pid_t pid;
    int ret;
    pid = fork();
    if(pid>0)
  exit(0);
    pid = setsid();
    if(pid == -1)
  sys_err("setsid error");
    ret = chdir("/home/book/test/06_session");
    if(ret == -1){
  sys_err("chdir error");
    }
    umask(0022);
    close(STDIN_FILENO);
    int fd = open("/dev/null",O_RDWR);
    if(fd == -1)
  sys_err("open error");
    dup2(fd,STDOUT_FILENO);
    dup2(fd,STDERR_FILENO);
    while(1);
    return 0;
}

1.3 线程概念


1.3.1 什么是线程

1670992660625.jpg

LWP:light weight process 轻量级的进程,本质仍是进程(在Linux环境下)

进程:独立地址空间,拥有PCB

线程:有独立的PCB,但没有独立的地址空间(共享)

区别:在于是否共享地址空间。 独居(进程);合租(线程)。


Linux下:

-------------线程:最小的执行单位

-------------进程:最小分配资源单位,可看成是只有一个线程的进程。


1.3.2 linux内核线程实现原理


类Unix系统中,早期是没有“线程”概念的,80年代才引入,借助进程机制实现出了线程的概念。因此在这类系统中,进程和线程关系密切。


轻量级进程(light-weight process),也有PCB,创建线程使用的底层函数和进程一样,都是clone

从内核里看进程和线程是一样的,都有各自不同的PCB,但是PCB中指向内存资源的三级页表是相同的

进程可以蜕变成线程

线程可看做寄存器和栈的集合

在linux下,线程最是小的执行单位;进程是最小的分配资源单位

察看LWP号:

ps –Lf pid 查看指定线程的lwp号。

1670992755862.jpg

三级映射:进程PCB --> 页目录(可看成数组,首地址位于PCB中) --> 页表 --> 物理页面 --> 内存单元

参考:《Linux内核源代码情景分析》 ----毛德操

1670992773187.jpg

对于进程来说,相同的地址(同一个虚拟地址)在不同的进程中,反复使用而不冲突。原因是他们虽虚拟址一样,但,页目录、页表、物理页面各不相同。相同的虚拟址,映射到不同的物理页面内存单元,最终访问不同的物理页面。

但!线程不同!两个线程具有各自独立的PCB,但共享同一个页目录,也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。

实际上,无论是创建进程的fork,还是创建线程的pthread_create,底层实现都是调用同一个内核函数clone。

如果复制对方的地址空间,那么就产出一个“进程”;如果共享对方的地址空间,就产生一个“线程”。

因此:Linux内核是不区分进程和线程的。只在用户层面上进行区分。所以,线程所有操作函数 pthread_* 是库函数,而非系统调用。


1.3.3 线程共享资源


1.文件描述符表

2.每种信号的处理方式

3.当前工作目录

4.用户ID和组ID

5.内存地址空间 (.text/.data/.bss/heap/共享库)


1.3.4 线程非共享资源


1.线程id

2.处理器现场和栈指针(内核栈)

3.独立的栈空间(用户空间栈)

4.errno变量

5.信号屏蔽字

6.调度优先级


1.3.5 线程优缺点


优点:

提高程序并发性

开销小

数据通信、共享数据方便


缺点:

库函数,不稳定

调试、编写困难、gdb不支持

对信号支持不好 优点相对突出,缺点均不是硬伤。 Linux下由于实现方法导致进程、线程差别不是很大。


1.4 线程控制原语


1.4.1 pthread_self函数


获取线程ID。其作用对应进程中 getpid() 函数。

pthread_t pthread_self(void); 
返回值:
成功:0; 
失败:无!
  线程ID:pthread_t类型,本质:在Linux下为无符号整数(%lu),其他系统中可能是结构体实现
  线程ID是进程内部,识别标志。(两个进程间,线程ID允许相同)


注意:可以通过pthread_create传出参数来获取线程ID。


1.4.2 pthread_create 函数


创建一个新线程。 其作用,对应进程中fork() 函数。

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
返回值:
  成功:0; 
  失败:错误号  -----Linux环境下,所有线程特点,失败均直接返回错误号。
参数: 
  pthread_t:当前Linux中可理解为:typedef  unsigned long int  pthread_t;
  参数1:传出参数,保存系统为我们分配好的线程ID
  参数2:通常传NULL,表示使用线程默认属性。若想使用具体属性也可以修改该参数。
  参数3:函数指针,指向线程主函数(线程体),该函数运行结束,则线程结束。
  参数4:线程主函数执行期间所使用的参数。


在一个线程中调用pthread_create()创建新的线程后,当前线程从pthread_create()返回继续往下执行,而新的线程所执行的代码由我们传给pthread_create的函数指针start_routine决定。start_routine函数接收一个参数,是通过pthread_create的arg参数传递给它的,该参数的类型为void *,这个指针按什么类型解释由调用者自己定义。start_routine的返回值类型也是void *,这个指针的含义同样由调用者自己定义。start_routine返回时,这个线程就退出了,其它线程可以调用pthread_join得到start_routine的返回值,类似于父进程调用wait(2)得到子进程的退出状态,稍后详细介绍pthread_join。 pthread_create成功返回后,新创建的线程的id被填写到thread参数所指向的内存单元。我们知道进程id的类型是pid_t,每个进程的id在整个系统中是唯一的,调用getpid(2)可以获得当前进程的id,是一个正整数值。线程id的类型是thread_t,它只在当前进程中保证是唯一的,在不同的系统中thread_t这个类型有不同的实现,它可能是一个整数值,也可能是一个结构体,也可能是一个地址,所以不能简单地当成整数用printf打印,调用pthread_self(3)可以获得当前线程的id。

attr参数表示线程属性,本节不深入讨论线程属性,所有代码例子都传NULL给attr参数,表示线程属性取缺省值,感兴趣的读者可以参考APUE。

相关文章
|
3月前
|
监控 关系型数据库 MySQL
在CentOS系统中,如何统计哪个进程打开了文件描述符?
利用上述方法,你可以有效地监控和统计CentOS系统中的进程打开的文件描述符数量,以帮助排查错误或优化系统配置。通过组合使用各种工具和命令,可以获得对系统状态和行为的深入了解,进而做出相应的调整和
184 5
|
3月前
|
Java 测试技术 API
【JUC】(1)带你重新认识进程与线程!!让你深层次了解线程运行的睡眠与打断!!
JUC是什么?你可以说它就是研究Java方面的并发过程。本篇是JUC专栏的第一章!带你了解并行与并发、线程与程序、线程的启动与休眠、打断和等待!全是干货!快快快!
622 2
|
3月前
|
JSON 网络协议 安全
【Java】(10)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
222 1
|
3月前
|
JSON 网络协议 安全
【Java基础】(1)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
241 1
|
11月前
|
存储 Linux API
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
在计算机系统的底层架构中,操作系统肩负着资源管理与任务调度的重任。当我们启动各类应用程序时,其背后复杂的运作机制便悄然展开。程序,作为静态的指令集合,如何在系统中实现动态执行?本文带你一探究竟!
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
|
9月前
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
322 67
|
7月前
|
调度 开发工具 Android开发
【HarmonyOS Next】鸿蒙应用进程和线程详解
进程的定义: 进程是系统进行资源分配的基本单位,是操作系统结构的基础。 在鸿蒙系统中,一个应用下会有三类进程:
270 0
|
10月前
|
弹性计算 运维 监控
基于进程热点分析与系统资源优化的智能运维实践
智能服务器管理平台提供直观的可视化界面,助力高效操作系统管理。核心功能包括运维监控、智能助手和扩展插件管理,支持系统健康监控、故障诊断等,确保集群稳定运行。首次使用需激活服务并安装管控组件。平台还提供进程热点追踪、性能观测与优化建议,帮助开发人员快速识别和解决性能瓶颈。定期分析和多维度监控可提前预警潜在问题,保障系统长期稳定运行。
436 17
|
10月前
|
SQL 监控 网络协议
YashanDB进程线程体系
YashanDB进程线程体系
|
10月前
|
Linux
Linux:守护进程(进程组、会话和守护进程)
守护进程在 Linux 系统中扮演着重要角色,通过后台执行关键任务和服务,确保系统的稳定运行。理解进程组和会话的概念,是正确创建和管理守护进程的基础。使用现代的 `systemd` 或传统的 `init.d` 方法,可以有效地管理守护进程,提升系统的可靠性和可维护性。希望本文能帮助读者深入理解并掌握 Linux 守护进程的相关知识。
526 7

热门文章

最新文章