【Linux】进程理解与学习Ⅰ-进程概念

简介: 【Linux】进程理解与学习Ⅰ-进程概念

进程概念



什么是进程?


进程是什么?我们打开任务管理器可以看到有很多的程序正在运行状态,并且上面写着进程二字。难道进程就是指这些被运行起来的程序吗?课本上对于进程是这么说的:程序的一个执行实例,正在执行的程序等。


1.png


windows下的进程


但是实际上这种说法并不完全准确?(举个例子,一个仅仅进入学校的人,并不能算是这个学校的学生,只有这个人的信息被加载到学校的教务系统,并且被这个学校所管理的人,才称得上学生。这里的学校就是指内存,数据只有加载到内存,并被OS所管理,这才算是一个完整的进程)。


2.png


os管理进程


在前文我们知道了cpu一般不会与外设进行直接沟通,而是与内存打交道。所以我们在磁盘上的程序被运行时,要将数据与代码加载到内存中。由操作系统来进行管理。具体怎么来管理呢?先描述,再组织。


所谓的 先描述实际上是指 OS会用一个 特定的结构体( PCB/task_struct)来 提取该进程的各种属性(这里的属性与加载到内存中的数据与代码无关,或者说仅仅只有一点点的关系,即可以通过对应的 task_struct找到该进程的代码和数据)。 组织是指 OS会以链表或者其它的数据结构将各个task_struct组织起来,方便管理。( 对进程的修改--->对链表或者其它数据结构的增删查改, 比如我们结束一个进程,实际上就是删掉数据结构中对应的pcb)

★上面啰嗦一大堆,无非就是说两个事:


结论一:进程=os内核关于该进程的相关数据结构(PCB/task_struct)+当前程序加载到内存的代码与数据。


结论二:OS如何管理进程?先描述(pcb/task_struct),再组织(链表等数据结构)。


PCB — 进程控制块


进程需要被OS管理,管理的本质就是先描述,再组织。而PCB就是用来描述进程的一种特定结构体。在Linux系统下的PCB就是task_struct。


task_struct内容分类


task_struct结构体中主要包含了以下信息,了解一下即可:


标示符: 描述本进程的唯一标示符,用来区别其他进程。

状态: 任务状态,退出代码,退出信号等。

优先级: 相对于其他进程的优先级。

程序计数器: 程序中即将被执行的下一条指令的地址。

内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针

上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。

I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。

记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。

其他信息


如何查看进程


第一种方法:通过ps指令

我们输入ps axj就可以查看当前所有进程信息,同时,由于进程信息较多,我们可以利用之前学过的管道,以及grep用来筛选过滤,从而拿到我们想要的进程信息。(ps -l可以查看当前bash下的进程信息)如下:


3.png


第二种方法:通过函数getpid()

在上面task_struct内容中,有一个是标识符,用来区分其他进程。这里的标识符,实际就是指PID。每一个进程都有自己的pid,并且每一次运行,pid的值都会发生变化(一般都是逐渐递增,当下一次重新登陆时,又是随机值)。


4.png


而我们可以通过系统调用函数getpid()来获取当前进程的pid。我们可以用man手册来查询getpid()的使用。我们可以通过如下的简单代码来验证。


#include<stdio.h>
//头文件包含
#include<unistd.h>
#include<sys/types.h>
int main()
{
   while(1)
   {
     //获取当前进程pid
     printf("hello world,我的pid:%d\n",getpid());                                             
     sleep(1);                                                                     
   }                                                                               
   return 0;                                                                       
 }


5.png


第三种方法:在路径/proc下查看

事实上,我们在执行一个程序时,会在/proc目录下生成一个以当前程序的pid命名的目录文件,该目录文件内包含了当前进程的所有信息。并且还有一个特点:当该程序停止运行时,以pid命名的文件会自动销毁。


6.png


如何中止进程


★三种方法:


我们可以通过指令kill -9进程pid来中止进程


通过热键ctrl c来中止当前进程


通过指令killall 进程名称 来中止进程


7.png


三种方式终止进程


父子进程



PPID


进程之间存在父子关系,我们知道,bash是命令行解释器,当我们在命令行输入指令执行一个进程时,我们执行的进程就是bash的子进程。究竟是否如我们所说?我们可以验证一下,当然,在此之前我们要先谈一下PPID,PPID就是当前进程的父进程的pid。


8.png


fork创建子进程


我们也可以通过系统调用函数fork用来给当前进程创建子进程。我们用man手册查询fork的用法。


9.png


我们可以通过如下代码来进行简单测试:


#include<stdio.h>
#include<assert.h>
#include<unistd.h> 
int main()
{
   //我们用ret来接受fork的返回值
   pid_t ret=fork();
   assert(ret!=-1);//断言一下
   //我们通常使用if语句,用来进行执行流分流
   if(ret == 0)                            
   {           
     while(1)
     {       
       //此时是子进程,fork给子进程返回0
       printf("我是子进程,pid:%d,ppid:%d,ret:%d,&ret:%p\n",getpid(),getppid(),ret,&ret);        
       sleep(1);                                                                         
     }          
   }  
   else if(ret >0)
   {              
     while(1)
     {       
       //此时是父进程,fork给父进程返回子进程的pid
       printf("我是父进程,pid:%d,ppid:%d,ret:%d,&ret:%p\n",getpid(),getppid(),ret,&ret);
       sleep(1);                                                                         
     }          
   }
   return 0;
 }


运行结果


10.png


我们发现,确实如此,不过这里有一个疑问,为什么ret的地址相同,但是ret的值却不相同呢?我们从未见过这种现象:同一个变量竟然有两个返回值。这是为什么呢?实际上,我们在函数的最后有一个return 0,而fork之后的代码是父子进程共享的,也就是说,return这个语句被执行了两次,并且当return执行时,函数体内部是已经执行完了的。所以会有两个返回值。


为了验证fork之后的代码,被父子进程共享,我们可以写一个简简单单的代码用来测试一下:


#include<stdio.h>
#include<unistd.h>
 int main()
 {
  int ret = fork();
  //这里只有一个printf
  printf("hello proc,pid:%d,ppid:%d,ret:%d\n", getpid(),getppid(),ret);                          
  sleep(1);
  return 0;
 }


11.png


运行结果


我们发现,确实如此。不仅如此,进程还具有独立性,我们可以定义一个全局变量,父进程对


全局变量进行修改,我们发现不会影响到子进程中的那个全局变量。我们也可以进行验证:


#include<stdio.h>
#include<unistd.h>
//定义全局变量
int a=100;
int main()
 {
   pid_t ret=fork();
   if(ret == 0)
   {
     while(1)
     {
       //子进程,不对a做修改
       printf("我是子进程,a=%d,&a=:%p\n",a,&a);
       sleep(1);
     }
   }
   else 
   {
     while(1)
     {
       //父进程,对全局变量a进行修改                                                            
       a+=100;
       //假如进程不具有独立性,那么父进程的修改也会影响子进程,究竟会不会呢?
       printf("我是父进程,a=%d,&a=:%p\n",a,&a);
       sleep(1);
     }
   }
   return 0;
 }


12.png


结果


我们发现确实如此,不过为什么同一个地址,对内容进行修改却不会互相影响呢?实际上这里的地址并不是真正的物理地址,并且当进程尝试对数据进行修改时,还会触发写时拷贝。(具体放在后面进程地址空间章节详细讲解)。


总结


★上面写了这么多,总结如下:


命令行启动的程序,都会变成bash的子进程


我们可以通过fork为当前进程创建子进程,fork的返回值给子进程返回0,给父进程返回子进程的pid,创建进程失败时返回-1


fork之后的代码被父子进程共享(但是谁先运行不确定)


进程具有独立性,父子进程也是如此,对其中一个进程的修改不会影响另一个进程


独立性体现在两方面:1、代码方面是可读的


2、数据方面,当一个执行流尝试修改数据时,OS会给我们的进程触发写时拷贝(后面章节详细讲解)。


相关文章
|
6天前
|
存储 IDE Linux
零基础保姆级教程!手把手教你免费玩转Linux CentOS安装+学习环境搭建(附避坑指南)
本文详细介绍了在VMware虚拟机中安装CentOS 6.8的全过程。首先,需确保已安装VMware并开启V-CPU虚拟化功能,可通过BIOS设置或使用LeoMoon CPU-V工具检测。接着,下载CentOS镜像文件,并在VMware中新建虚拟机,配置CPU、内存、硬盘等参数。最后,加载ISO镜像启动虚拟机,按照提示完成CentOS的安装,包括语言、键盘、存储方式、地区、密码设置及硬盘分区等步骤。安装完成后,以root用户登录即可进入系统桌面,开始学习Linux命令和操作。
51 12
零基础保姆级教程!手把手教你免费玩转Linux CentOS安装+学习环境搭建(附避坑指南)
|
11天前
|
Linux Shell
Linux 进程前台后台切换与作业控制
进程前台/后台切换及作业控制简介: 在 Shell 中,启动的程序默认为前台进程,会占用终端直到执行完毕。例如,执行 `./shella.sh` 时,终端会被占用。为避免不便,可将命令放到后台运行,如 `./shella.sh &`,此时终端命令行立即返回,可继续输入其他命令。 常用作业控制命令: - `fg %1`:将后台作业切换到前台。 - `Ctrl + Z`:暂停前台作业并放到后台。 - `bg %1`:让暂停的后台作业继续执行。 - `kill %1`:终止后台作业。 优先级调整:
32 5
|
11天前
|
Linux 应用服务中间件 nginx
Linux 进程管理基础
Linux 进程是操作系统中运行程序的实例,彼此隔离以确保安全性和稳定性。常用命令查看和管理进程:`ps` 显示当前终端会话相关进程;`ps aux` 和 `ps -ef` 显示所有进程信息;`ps -u username` 查看特定用户进程;`ps -e | grep &lt;进程名&gt;` 查找特定进程;`ps -p &lt;PID&gt;` 查看指定 PID 的进程详情。终止进程可用 `kill &lt;PID&gt;` 或 `pkill &lt;进程名&gt;`,强制终止加 `-9` 选项。
20 3
|
11天前
|
存储 算法 数据处理
进程基础:概念、状态与生命周期
进程是操作系统进行资源分配和调度的基本单位,由程序段、数据段和进程控制块(PCB)组成。线程是进程中更小的执行单元,能独立运行且共享进程资源,具有轻量级和并发性特点。进程状态包括就绪、运行和阻塞,其生命周期分为创建、就绪、运行、阻塞和终止阶段。
50 2
|
12天前
|
Linux
Linux:守护进程(进程组、会话和守护进程)
守护进程在 Linux 系统中扮演着重要角色,通过后台执行关键任务和服务,确保系统的稳定运行。理解进程组和会话的概念,是正确创建和管理守护进程的基础。使用现代的 `systemd` 或传统的 `init.d` 方法,可以有效地管理守护进程,提升系统的可靠性和可维护性。希望本文能帮助读者深入理解并掌握 Linux 守护进程的相关知识。
27 7
|
17天前
|
存储 Linux API
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
在计算机系统的底层架构中,操作系统肩负着资源管理与任务调度的重任。当我们启动各类应用程序时,其背后复杂的运作机制便悄然展开。程序,作为静态的指令集合,如何在系统中实现动态执行?本文带你一探究竟!
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
|
1月前
|
存储 网络协议 Linux
【Linux】进程IO|系统调用|open|write|文件描述符fd|封装|理解一切皆文件
本文详细介绍了Linux中的进程IO与系统调用,包括 `open`、`write`、`read`和 `close`函数及其用法,解释了文件描述符(fd)的概念,并深入探讨了Linux中的“一切皆文件”思想。这种设计极大地简化了系统编程,使得处理不同类型的IO设备变得更加一致和简单。通过本文的学习,您应该能够更好地理解和应用Linux中的进程IO操作,提高系统编程的效率和能力。
77 34
|
1月前
|
消息中间件 Linux C++
c++ linux通过实现独立进程之间的通信和传递字符串 demo
的进程间通信机制,适用于父子进程之间的数据传输。希望本文能帮助您更好地理解和应用Linux管道,提升开发效率。 在实际开发中,除了管道,还可以根据具体需求选择消息队列、共享内存、套接字等其他进程间通信方
68 16
|
2月前
|
消息中间件 Linux
Linux:进程间通信(共享内存详细讲解以及小项目使用和相关指令、消息队列、信号量)
通过上述讲解和代码示例,您可以理解和实现Linux系统中的进程间通信机制,包括共享内存、消息队列和信号量。这些机制在实际开发中非常重要,能够提高系统的并发处理能力和数据通信效率。希望本文能为您的学习和开发提供实用的指导和帮助。
185 20
|
3月前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
138 13