1. 前言
相信大家多多少少听说过进程这个词
先带大家做一个进程的简单的介绍:
课本概念:
程序的一个执行实例
或正在执行的程序内核观点:
担当分配系统资源(CPU,内存)的实体
本章重点:
本章会重点讲解操作系统是如何
管理进程的,PCB的概念以及Linux
下的PCB实体,到底什么是进程?
最后讲解进程对应的标识符:pid
和ppid的概念以及查看方式
注:建议先阅读这篇文章:
Linux进程学习基础
理解"先描述再再组织"的概念!
2. PCB初认识(os是怎样管理进程的?)
在冯诺依曼系统中讲到,管理的本质不是
真正的管理实体本身,而是管理它的数据
虽然现在我们不知道什么是进程,但是
我们可以通过先描述,再组织这一结论
得出,操作系统管理进程肯定也是管理
进程对应的数据,请看下图:
操作系统将可执行程序的各种数据提取
出来,再创建一个结构体把数据存进去
由于同时会存在多个进程,所以操作系统
使用链表或其他数据结构将它们链接在一起
虽然我们并不知道进程中都有什么数据
但是可以假设或者猜想一下:
struct data { //id //代码/函数地址 //状态(是否被CPU处理) //优先级 struct data* next }
新概念来了:
这个进程属性的结构体被称为PCB
也叫进程控制块
当然,PCB是这个结构体的总称,在Linux
系统下,PCB具体叫做:struct task_struct'
所以操作系统(os)是怎样管理进程的呢?
os对进程的管理被建模成为了
对链表中结构体的增删查改!
3. CPU对于进程列表的处理
进程被链接在链表中会等待CPU去PCB找
数据做处理,那么CPU怎么知道要处理哪些
数据呢?这不得不提到进程排队的概念:
把对应的PCB从链表中提取到
队列中排队,PCB中的数据不会
一次性被CPU处理完,它有时被处理
有时在等待被处理,这是一种动态
运行的特征,请看下图:
讲这些概念是想让大家了解,操作系统内
对于进程的控制十分复杂,一个PCB可能
链接到多个数据结构上,比如这里的PCB
既链接在管理PCB的链表上,又链接在
排队队列的队列中!
结论: 进程=可执行程序 + 内核数据结构(PCB)
4. 进程标识符:pid
每一个进程都有自己对应的pid
查看当前进程的信息:
使用指令:
ps ajx
这样查看的是所有的进程,很难帮助
我们学习,现在写一个死循环程序并运行
让它一直处于进程运行的状态:
#include<stdio.h> #include<unistd.h> int main() { while(1)//死循环 { printf("我现在是一个进程了\n"); sleep(1);//休眠一秒 } return 0; }
现在让程序运行起来,再去查看进程:
在所有进程中搜索我刚刚写的可执行程序:
使用指令:
ps ajx | grep mybin
将进程信息的第一行打印出来:
使用指令:
ps ajx | head -1
请看下面视频:
查看进程
可以看见当前mybin程序的进程pid是
8336,这里有两个mybin的原因是,grep
指令本身也要形成mybin文件,所以其实
第二个红字mybin是grep的!
5. 在Linux下使用指令终止进程
在我们的程序运行时,可以在运行的
地方按CTRL+c来结束进程,但是
还有一种方法可以结束进程:
使用指令:
kill -9 要杀掉的进程id
(注:这里的-9是信号参数,直接使用即可)
请看下面的视频演示:
使用指令结束进程
6. 系统调用函数:getpid
每次查看进程使用都要使用ps指令
我感觉非常的麻烦,于是这里有一个
系统调用的节后函数可以直接返回
当前进程的pid,由于操作系统是由C
语言编写的,所以可以直接在程序中调用此函数:
使用函数:
getpid
使用man手册查看getpid相关信息:
#include<stdio.h> #include<unistd.h> #include<sys/types.h> int main() { pid_t id = getpid(); while(1)//死循环 { printf("我现在是一个进程了,我的pid是: %d\n",id); sleep(1);//休眠一秒 } return 0; }
请看以下视频观察情况:
用系统调用函数查看pid
7. 父进程和子进程的概念
在使用ps指令查看进程详情时,除了
pid我们可以看见左边还有一个ppid
这是parent pid的意思,也就是父进程
的pid,请看下图:
再来学习一个可以查看父进程id的函数:
使用函数:
getppid()
现在我们将此函数进入C语言代码中来观察现象:
#include<stdio.h> #include<unistd.h> #include<sys/types.h> int main() { pid_t parid = getppid(); pid_t id = getpid(); while(1)//死循环 { printf("我现在是一个进程了,我的pid是: %d 我的ppid是: %d\n",id,parid); sleep(1);//休眠一秒 } return 0; }
请看以下视频观察情况:
父进程与子进程查看
可以发现,每次运行时,子进程的id都在变化
然而父进程的id一直没变!这是因为在命令行
中,父进程一般是命令行解释器:bash
现在可以去查看一下父进程的详情:
bash的pid查看
可以看见,bash的pid和打印出来的ppid一样
那么本篇文章先给出一个父子进程的结论
更多关于父子进程和创建子进程的内容我将
在下一篇文章讲解,这里只是先做了解
结论:
Linux中创建进程的方式有两种
1是命令行中直接启动可执行程序
2是通过代码创建进程(下篇文章的重点)
启动进程的本质就是创建进程,一般是
通过父进程创建子进程,构成一种父子关系
而命令行中启动的进程都是由bash为
父进程模拟创建子进程的!
8. 总结以及拓展
Linux进程的学习是Linux学习中
三座大山之一,它的抽象程度不亚于学习
大物时的薛定谔方程,所以看完本篇文章
你如果是一头雾水的话也不要怕,后期还会
有更多对于进程的理解和完善!
对于系统调用的拓展
我们使用的getpid和getppid是系统调用函数
而在冯诺依曼体系中讲到,如何用户想要访问
底层的数据必须经过系统调用这一门槛!
然而系统调用是怎样将pid或ppid
返回给用户的呢?其实很好理解
pid和ppid的值是数据,那么数据是被存储
在进程控制块PCB中的,而PCB的本质
是一个结构体,所以操作系统只需要写一个
函数,将结构体中的pid或ppid作为返回值
返回给用户即可,请看下图加深理解:
🔎 下期预告:Linux进程之代码创建进程 🔍