【现代操作系统-前三章理解】进程 线程 内存 执行程序 GPU 的理解

简介: 【现代操作系统-前三章理解】进程 线程 内存 执行程序 GPU 的理解

1668176146936.jpg

DDR3内存起始频率为800Hz,最高频率为2133Hz,最大支持64GB,我们常见的DDR3内存,一般是4/8/16GB DDR3

1333/1600/2133。


DDR4内存起始频率就达到了2133Hz,最高频率为3200Hz,最大支持128GB,目前常见的DDR4内存一般是8GB/16GB/32GB

DDR2 2133、2400/3200。


现代操作系统----笔记


Linux的鼻祖Linus Torvalds在回答有人提出的Minix的一个问题时,所说的第一句话就是"Read The Fucking Source Code",这就是RTFSC的来由。


直接操作硬件 比如 SATA硬盘 Serial ATA硬盘 很复杂 必须要OS帮忙


通过抽象 忽略具体实现细节


发展历史


1.真空管和穿孔卡片----

2.晶体管和批处理系统-------收集全部作业,找个工人把他输在垃圾电脑磁带里面,再用贵的电脑统一算磁带。

FMS作业 — $ job,100(分钟),1411444(计费账号),李奇坤(程序员名字)

然后$fortran 程序 然后 数据 --------一种语言

3.第三代集成电路和多道程序设计—IBM

System/360

采用集成电路 IC 集成电路(integrated circuit, IC

OS/360都是一个大系列 --像一个大恐龙

多道程序设计 —multiprogramming

SPOOLing技术


分时系统–交互


MULTICS就是一个大的计算中心 后来云计算借鉴了她 取得成功

后来贝尔实验室专家开发了个简单的MULTICS 给一个用户用的 后来就成了UNIX


演化出两个主要版本 一个伯克利的 一个POSIX 是IEEE的

Mini X流行了 因为用于服务教育


后来 芬兰 学生 编写了 Linux,借鉴很多Minix如 文件系统


4个人计算机PC

8080 intel CP/M系统


Bill Gates买了DOS系统 给IBM用


乔布斯 看到GUI 设计了苹果电脑

Macintosh

99年苹果公司用了梅隆大学的Mach内核 MAC OS X基于UNIX


微软决定Windows 运行在DOS上层 后来 win 98 上面还是有多 英特尔16位的汇编语言


然后他又做了个32位系统

但是那个设计师VMS的大哥 法院告了他

然后没办法 恩来是个大杀气的 NT版本完蛋了


只有Nt4.0可以

99年 NT5.0 改名windows2000 发布


然后2001年 发布了winXP 只是2000的升级版


这个系统寿命长达六年


原来这么近!


后来的系统版本 服务器端 和 客户端 分开发布


win server 2008啥的


07年 发布Vista想代替XP 没想到啊 太牛逼了 而且防盗版 大家不喜欢


然后win7到来


后来12年发布win8变得更加通用


Mac IOS Android系统有的改的就是 FreeBSD 伯克利的代码Unix


5 移动计算机


rtfsc

GPU的构成 成千上万的微核组成的处理器


GPU 初认识


指令集


1668176201495.jpg


最简单的指令处理过程

1668176222975.jpg

mov $0x1234, %eax


取指令—首先通过instr_fetch()取得这条指令的第一个字节0xb8.


译码


译码(instruction decode, ID)

在fetch_decode_exec()函数中用这条指令的第一个字节0xb8来查找switch-case的分支,

发现这一指令的操作数宽度是4字节的mov指令, 形式是将立即数移入寄存器(move immediate to register).


事实上, 一个字节最多只能区分256种不同的指令形式. 当指令形式的数目大于256时, 我们需要使用另外的方法来识别它们.

x86中有主要有两种方法来解决这个问题(在PA2中你都会遇到这两种情况):

一种方法是使用转义码(escape code), x86中有一个2字节转义码 0x0f, 当指令opcode的第一个字节是0x0f时, 表示需要再读入一个字节才能决定具体的指令形式(部分条件跳转指令就属于这种情况). 后来随着各种SSE指令集的加入, 使用2字节转义码也不足以表示所有的指令形式了, x86在2字节转义码的基础上又引入了3字节转义码, 当指令opcode的前两个字节是0x0f和0x38时, 表示需要再读入一个字节才能决定具体的指令形式.

另一种方法是使用ModR/M字节中的扩展opcode域来对opcode的长度进行扩充. 有些时候, 读入一个字节也还不能完全确定具体的指令形式, 这时候需要读入紧跟在opcode后面的ModR/M字节, 把其中的reg/opcode域当做opcode的一部分来解释, 才能决定具体的指令形式. x86把这些指令划分成不同的指令组(instruction group), 在同一个指令组中的指令需要通过ModR/M字节中的扩展opcode域来区分.


接下来还需要识别指令的操作数. 对于mov $0x1234, %eax指令来说, 识别操作数其实就是识别寄存器%eax和立即数$0x1234. 在x86中, 通用寄存器都有自己的编号,I2r形式的指令把寄存器编号也放在指令的第一个字节里面, 我们可以通过位运算将寄存器编号抽取出来; 立即数存放在指令的第二个字节, 可以很容易得到它. 需要说明的是, 由于立即数是指令的一部分, 我们还需要通过instr_fetch()函数来获得它.


执行


执行(execute, EX) 对于mov $0x1234, %eax指令来说,

执行阶段的工作就是把立即数$0x1234送到寄存器%eax中. 由于mov指令的功能可以统一成"把源操作数的值传送到目标操作数中",

而译码阶段已经把操作数都准备好了, 所以只需要针对mov指令编写一个执行辅助函数即可. 这个函数就是exec_mov(),

它是通过def_EHelper宏来定义的:

def_EHelper(mov) {
write_operand(s, id_dest, dsrc1);
print_asm_template2(mov); }

其中write_operand()函数会根据第二个参数中记录的类型的不同进行相应的写操作, 包括写寄存器和写内存.

print_asm_template2()是个宏, 用于输出带有两个操作数的指令的汇编形式.


更新PC

调用update_pc()即可.


处理器CPU


cpu


最简单的计算机


但只有存储器的计算机还是不能进行计算. 自然地, CPU需要肩负起计算的重任, 先驱为CPU创造了运算器, 这样就可以对数据进行各种处理了.


先驱发现, 有时候程序需要对同一个数据进行连续的处理. 例如要计算1+2+…+100, 就要对部分和sum进行累加,

如果每完成一次累加都需要把它写回存储器, 然后又把它从存储器中读出来继续加, 这样就太不方便了. 同时天下也没有免费的午餐,

存储器的大容量也是需要付出相应的代价的, 那就是速度慢, 这是先驱也无法违背的材料特性规律. 于是先驱为CPU创造了寄存器,

可以让CPU把正在处理中的数据暂时存放在其中.


寄存器的速度很快, 但容量却很小, 和存储器的特性正好互补, 它们之间也许会交织出新的故事呢, 不过目前我们还是顺其自然吧.


1668176306149.jpg


为了让强大的CPU成为忠诚的奴仆, 先驱还设计了"指令", 用来指示CPU对数据进行何种处理. 这样, 我们就可以通过指令来控制CPU,

让它做我们想做的事情了.


有了指令以后, 先驱提出了一个划时代的设想: 能否让程序来自动控制计算机的执行? 为了实现这个设想, 先驱和CPU作了一个简单的约定:

当执行完一条指令之后, 就继续执行下一条指令. 但CPU怎么知道现在执行到哪一条指令呢? 为此, 先驱为CPU创造了一个特殊的计数器,

叫"程序计数器"(Program Counter, PC). 在x86中, 它有一个特殊的名字, 叫EIP(Extended Instruction Pointer).


从此以后, 计算机就只需要做一件事情:


1668176317999.jpg


这样, 我们就有了一个足够简单的计算机了. 我们只要将一段指令序列放置在存储器中, 然后让PC指向第一条指令,

计算机就会自动执行这一段指令序列, 永不停止.


例如, 下面的指令序列可以计算1+2+…+100, 其中r1和r2是两个寄存器, 还有一个隐含的程序计数器PC, 它的初值是0.

为了帮助大家理解, 我们把指令的语义翻译成C代码放在右侧, 其中每一行C代码前都添加了一个语句标号:


1668176328251.jpg


这个全自动的执行过程实在是太美妙了! 事实上, 开拓者图灵在1936年就已经提出类似的核心思想, "计算机之父"可谓名不虚传.

而这个流传至今的核心思想, 就是"存储程序". 为了表达对图灵的敬仰, 我们也把上面这个最简单的计算机称为"图灵机"(Turing Machine, TRM). 或许你已经听说过"图灵机"这个作为计算模型时的概念,

不过在这里我们只强调作为一个最简单的真实计算机需要满足哪些条件:

1668176339587.jpg



PC+寄存器+加法器=======TRM 图灵机 turing machine


咦? 存储器, 计数器, 寄存器, 加法器, 这些不都是数字电路课上学习过的部件吗? 也许你会觉得难以置信, 但先驱说,

你正在面对着的那台无所不能的计算机, 就是由数字电路组成的! 不过, 我们在程序设计课上写的程序是C代码.

但如果计算机真的是个只能懂0和1的巨大数字电路, 这个冷冰冰的电路又是如何理解凝结了人类智慧结晶的C代码的呢? 先驱说,

计算机诞生的那些年还没有C语言, 大家都是直接编写对人类来说晦涩难懂的机器指令, 那是他所见过的最早的对电子计算机的编程方式了.

后来人们发明了高级语言和编译器, 能把我们写的高级语言代码进行各种处理, 最后生成功能等价的, CPU能理解的指令. CPU执行这些指令,

就相当于是执行了我们写的代码. 今天的计算机本质上还是"存储程序"这种天然愚钝的工作方式, 是经过了无数计算机科学家们的努力,

我们今天才可以轻松地使用计算机.


1668176351228.jpg


既然计算机是一个数组逻辑电路, 那么我们可以把计算机划分成两部分, 一部分由所有时序逻辑部件(存储器, 计数器, 寄存器)构成,

另一部分则是剩余的组合逻辑部件(如加法器等). 这样以后, 我们就可以从状态机模型的视角来理解计算机的工作过程了:

在每个时钟周期到来的时候, 计算机根据当前时序逻辑部件的状态, 在组合逻辑部件的作用下, 计算出并转移到下一时钟周期的新状态.


计算机的这个视角有什么用呢? 好像除了让你明白计算机硬件不再那么神秘之外, 也没什么特别的用处.

毕竟ICS课不要求大家用硬件描述语言来实现计算机硬件, 大家只要相信这件事能做成就可以了.


不过对于程序来说, 这个视角的作用会超乎你的想象.


计算机是一个状态机 时钟周期来的时候 根据时序逻辑部件的状态 在组合逻辑部件的作用下 计算出并转移到下一个时钟周期的新状态


如果把计算机看成一个状态机, 那么运行在计算机上面的程序又是什么呢?


我们知道程序是由指令构成的, 那么我们先看看一条指令在状态机的模型里面是什么. 不难理解, 计算机正是通过执行指令的方式来改变自身状态的,

比如执行一条加法指令, 就可以把两个寄存器的值相加, 然后把结果更新到第三个寄存器中; 如果执行一条跳转指令, 就会直接修改PC的值,

使得计算机从新PC的位置开始执行新的指令. 所以在状态机模型里面, 指令可以看成是计算机进行一次状态转移的输入激励.


ICS课本的1.1.3小节中介绍了一个很简单的计算机. 这个计算机有4个8位的寄存器, 一个4位PC,

以及一段16字节的内存(也就是存储器), 那么这个计算机可以表示比特总数为B = 4 * 8 + 4 + 16 * 8 = 164,

因此这个计算机总共可以有N = 2^B = 2^164种不同的状态. 假设这个在这个计算机中, 所有指令的行为都是确定的,

那么给定N个状态中的任意一个, 其转移之后的新状态也是唯一确定的. 一般来说N非常大, 下图展示了N=50时某计算机的状态转移图.


1668176395001.jpg


现在我们就可以通过状态机的视角来解释"程序在计算机上运行"的本质了: 给定一个程序, 把它放到计算机的内存中,

就相当于在状态数量为N的状态转移图中指定了一个初始状态, 程序运行的过程就是从这个初始状态开始, 每执行完一条指令,

就会进行一次确定的状态转移. 也就是说, 程序也可以看成一个状态机! 这个状态机是上文提到的大状态机(状态数量为N)的子集.


例如, 假设某程序在上图所示的计算机中运行, 其初始状态为左上角的8号状态, 那么这个程序对应的状态机为


1668176409741.jpg1668176422024.jpg


通过上面必做题的例子, 你应该更进一步体会到"程序是如何在计算机上运行"了. 我们其实可以从两个互补的视角来看待同一个程序:


一个是以代码(或指令序列)为表现形式的静态视角, 大家经常说的"写程序"/“看代码”, 其实说的都是这个静态视角.

这个视角的一个好处是描述精简, 分支, 循环和函数调用的组合使得我们可以通过少量代码实现出很复杂的功能.

但这也可能会使得我们对程序行为的理解造成困难. 另一个是以状态机的状态转移为运行效果的动态视角, 它直接刻画了"程序在计算机上运行"的本质.

但这一视角的状态数量非常巨大, 程序代码中的所有循环和函数调用都以指令的粒度被完全展开, 使得我们难以掌握程序的整体语义.

但对于程序的局部行为, 尤其是从静态视角来看难以理解的行为, 状态机视角可以让我们清楚地了解相应的细节.

1668176431564.jpg


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
28天前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
65 1
|
1月前
|
调度 开发者 Python
深入浅出操作系统:进程与线程的奥秘
在数字世界的底层,操作系统扮演着不可或缺的角色。它如同一位高效的管家,协调和控制着计算机硬件与软件资源。本文将拨开迷雾,深入探索操作系统中两个核心概念——进程与线程。我们将从它们的诞生谈起,逐步剖析它们的本质、区别以及如何影响我们日常使用的应用程序性能。通过简单的比喻,我们将理解这些看似抽象的概念,并学会如何在编程实践中高效利用进程与线程。准备好跟随我一起,揭开操作系统的神秘面纱,让我们的代码运行得更加流畅吧!
|
30天前
|
C语言 开发者 内存技术
探索操作系统核心:从进程管理到内存分配
本文将深入探讨操作系统的两大核心功能——进程管理和内存分配。通过直观的代码示例,我们将了解如何在操作系统中实现这些基本功能,以及它们如何影响系统性能和稳定性。文章旨在为读者提供一个清晰的操作系统内部工作机制视角,同时强调理解和掌握这些概念对于任何软件开发人员的重要性。
|
29天前
|
Linux 调度 C语言
深入理解操作系统:从进程管理到内存优化
本文旨在为读者提供一次深入浅出的操作系统之旅,从进程管理的基本概念出发,逐步探索到内存管理的高级技巧。我们将通过实际代码示例,揭示操作系统如何高效地调度和优化资源,确保系统稳定运行。无论你是初学者还是有一定基础的开发者,这篇文章都将为你打开一扇了解操作系统深层工作原理的大门。
|
30天前
|
存储 算法 调度
深入理解操作系统:进程调度的奥秘
在数字世界的心脏跳动着的是操作系统,它如同一个无形的指挥官,协调着每一个程序和进程。本文将揭开操作系统中进程调度的神秘面纱,带你领略时间片轮转、优先级调度等策略背后的智慧。从理论到实践,我们将一起探索如何通过代码示例来模拟简单的进程调度,从而更深刻地理解这一核心机制。准备好跟随我的步伐,一起走进操作系统的世界吧!
|
30天前
|
算法 调度 开发者
深入理解操作系统:进程与线程的管理
在数字世界的复杂编织中,操作系统如同一位精明的指挥家,协调着每一个音符的奏响。本篇文章将带领读者穿越操作系统的幕后,探索进程与线程管理的奥秘。从进程的诞生到线程的舞蹈,我们将一起见证这场微观世界的华丽变奏。通过深入浅出的解释和生动的比喻,本文旨在揭示操作系统如何高效地处理多任务,确保系统的稳定性和效率。让我们一起跟随代码的步伐,走进操作系统的内心世界。
|
1月前
|
运维 监控 Linux
Linux操作系统的守护进程与服务管理深度剖析####
本文作为一篇技术性文章,旨在深入探讨Linux操作系统中守护进程与服务管理的机制、工具及实践策略。不同于传统的摘要概述,本文将以“守护进程的生命周期”为核心线索,串联起Linux服务管理的各个方面,从守护进程的定义与特性出发,逐步深入到Systemd的工作原理、服务单元文件编写、服务状态管理以及故障排查技巧,为读者呈现一幅Linux服务管理的全景图。 ####
|
1月前
|
消息中间件 算法 调度
深入理解操作系统之进程管理
本文旨在通过深入浅出的方式,带领读者探索操作系统中的核心概念——进程管理。我们将从进程的定义和重要性出发,逐步解析进程状态、进程调度、以及进程同步与通信等关键知识点。文章将结合具体代码示例,帮助读者构建起对进程管理机制的全面认识,并在实践中加深理解。
|
6月前
|
运维 关系型数据库 MySQL
掌握taskset:优化你的Linux进程,提升系统性能
在多核处理器成为现代计算标准的今天,运维人员和性能调优人员面临着如何有效利用这些处理能力的挑战。优化进程运行的位置不仅可以提高性能,还能更好地管理和分配系统资源。 其中,taskset命令是一个强大的工具,它允许管理员将进程绑定到特定的CPU核心,减少上下文切换的开销,从而提升整体效率。
掌握taskset:优化你的Linux进程,提升系统性能
|
6月前
|
弹性计算 Linux 区块链
Linux系统CPU异常占用(minerd 、tplink等挖矿进程)
Linux系统CPU异常占用(minerd 、tplink等挖矿进程)
199 4
Linux系统CPU异常占用(minerd 、tplink等挖矿进程)