零、前言
本章主要讲解操作系统的一些基础概念知识,为进程的学习做铺垫
一、冯诺依曼体系结构
概念:
冯诺依曼体系结构规定了硬件上的数据流动,而大部分计算机都遵守冯诺依曼体系,如笔记本,服务器等
示图:
计算机基本硬件组成:
输入单元:包括键盘, 鼠标,扫描仪, 写板等
中央处理器(CPU):含有运算器和控制器等
输出单元:显示器,打印机等
存储器:物理内存
注:输入单元和输出单元统称外设
工作原理:
执行程序时,输入设备的数据先预加载到存储器中,通过存储器将数据交给cpu进行处理,cpu再将得到的结果预写入写回存储器,最后再由存储器将结果刷新到输出设备上
注意:
不考虑缓存情况CPU能且只能对内存进行读写,不能访问外设(输入或输出设备)
外设(输入或输出设备)要输入或者输出数据,也只能写入内存或者从内存中读取
所有设备都只能直接和内存打交道
示例:登录上qq开始和某位朋友聊天的数据的流动过程
你的电脑:输入设备键盘将数据写到内存,内存再将数据给CPU,CPU得到结果再将数据写入内存,最后内存将数据刷新到网卡
朋友的电脑:输入设备网卡将数据写到内存,内存再将数据给CPU,CPU得到结果再将数据写入内存,最后内存将数据刷新到显示器上
为什么运行程序必须先加载到内存:
这是即是冯诺依曼体系结构规定的,也是由于存储器分级的原因导致的
示图:存储器层次结构
内存比较便宜速度慢,CPU速度快但是贵,为了平衡速度与经济CPU一般不会太大,所以CPU不能直接存储数据
对于外设的输入输出效率会更慢,如果直接和CPU沟通会导致整个程序变得迟缓,所以由内存作为中间者和所有设备进行直接沟通
二、操作系统
概念:
任何计算机系统都包含一个基本的程序集合,称为操作系统(OS)
操作系统包括:
内核(进程管理,内存管理,文件管理,驱动管理)
其他程序(例如函数库, shell程序等等)
设计OS的目的:
与硬件交互,管理所有的软硬件资源
为用户程序(应用程序)提供一个良好的执行环境
注:OS需要保护系统软硬件,所以它对任何用户都不信任,需要通过OS才能访问系统软硬件
定位:
操作系统也被称作进行软硬件资源管理的软件
如何理解 “管理”:
操作系统作为管理者,主要做事情决策
而操作系统之下的驱动作为执行者,进行执行操作系统的决定
最后的底层硬件则是一个被管理的角色
示图:
怎么进行管理:
描述:先对被管理者进行描述,将其属性数据获取(数据写到struct结构体中)
组织:用链表或其他高效的数据结构进行管理数据(结构体),也就是对数据的操作达到管理的效果
系统调用和库函数概念:
在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口,叫做系统调用
系统调用在使用上功能比较基础,但对用户的要求相对也比较高,所以开发者对部分系统调用进行适度封装,从而形成库,利于更上层用户或者开发者进行二次开发
三、进程
概念:
进程是程序的一个执行实例,从内核的角度上看进程是担当分配系统资源(CPU时间,内存)的实体
即进程=程序+内核的PCB
1、描述进程-PCB
概念:
进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合;在Linux中描述进程的结构体叫做task_struct
Linux操作系统下的PCB是: task_struct-PCB的一种,task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程的信息
task_ struct内容分类:
标示符: 描述本进程的唯一标示符,用来区别其他进程 状态: 任务状态,退出代码,退出信号等 优先级: 相对于其他进程的优先级 程序计数器: 程序中即将被执行的下一条指令的地址 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针 上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器 //当多个程序需要同时被执行,而一个程序有执行的时间片,达到时间需要切换程序,切换到恢复的过程就需要上下文数据发挥作用,达到无缝切换的效果 I/O状态信息: 包括显示的I/O请求,分配给进程的I/ O设备和被进程使用的文件列表 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等 其他信息
注:运行在系统里的进程都以task_struct链表的形式存在内核里
2、查看进程
进程的信息可以通过 /proc 系统文件夹查看
示例:
大多数进程信息同样可以使用top和ps这些用户级工具来获取
示例:
3、获取进程标示符
系统调用函数:
使用getpid()系统调用函数获取当前进程id(PID)
使用getppid()系统调用函数获取当前进程的父进程id(PPID)
注:getpid()和getppid()函数需要包含头文件unistd.h
示例:
#include <stdio.h> #include <unistd.h> int main() { printf("pid: %d\n", getpid()); printf("ppid: %d\n", getppid()); return 0; }
4、创建进程-fork()
fork()功能:
为当前进程创建子进程,父子进程代码共享,数据各自开辟空间私有一份(采用写时拷贝:进行写入时触发拷贝)
fork()返回值:
对于父进程,如果创建成功返回子进程的pid,否则返回负数
对于子进程返回0(成功创建)
注意:
对子进程返回0,是因为子进程只有一个父进程,可以直接找到对应父进程
对父进程返回子进程pid的意义是可以在父进程里直接得到子进程ID(可能有多个子进程),对某个子进程进行操作和管理
注:fork返回类型是pid_t,需要包含头文件 sys/types.h
- 示例:
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main() { pid_t ret = fork(); printf("hello proc : %d!, ret: %d\n", getpid(), ret); sleep(1); return 0; }
- 父子进程分流执行:
我们创建子进程的意义是为了与父进程进行不同任务,因为父子进程的代码共享,所以我们采用分支结构进行分流执行程序
- 示例:
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main() { int ret = fork(); if(ret < 0){ perror("fork"); return 1; } else if(ret == 0){ //child printf("I am child : %d!, ret: %d\n", getpid(), ret); }else{ //father printf("I am father : %d!, ret: %d\n", getpid(), ret); } sleep(1); return 0; }
- 为什么ret有两个返回值:
fork()函数在return的前一刻,其主体任务全部完成,也就是子进程成功创建,此时父子进程代码共享,数据各有一份(写时拷贝),在返回时发生写实拷贝,对于父进程的ret则是返回的子进程的pid,对于子进程的ret则是返回的0