本节书摘来自华章社区《C语言程序设计:问题与求解方法》一书中的第1章,第1.2节计算机系统,作者:何 勤,更多章节内容可以访问云栖社区“华章社区”公众号查看
1.2 计算机系统
定义:计算机系统是一个通过执行程序,把数据加工成信息的二进制数字信号处理设备。
对定义的解释:
1)程序:是由完成某一任务的很多条指令顺序组成的。
2)数据和信息:
一般认为“数据”是对某个事物(或状态)的原始记录,而“信息”则是通过对数据进行某种加工(比如计算、排序、查找、思考、分析、综合、解题等)而提取出来的正确结果。
对同一批数据,随着加工方式不同,一般可以得到多种不同的信息;对数据的加工提取方式不正确,会得到错误的信息。
数据和信息这两个概念又是相对的。也就是说,对于一种任务来说是信息的,对于另一种更高级的任务来说又可以是数据。
人类通过五官得到数据,通过大脑的思考将数据加工成信息;而计算机通过输入设备得到数据,通过运行程序将数据加工成信息。
类似于理想厨房系统,计算机系统也是由硬件和软件(包括程序、数据和一些相关文档)组成的,参见图1-1。
1.2.1 计算机系统中的硬件
计算机硬件主要由以下四种部件构成:
三条总线(相当于三条传送带)。
内存—又称为主存储器(相当于自动冰箱)。
CPU—又称为中央处理单元或处理器(相当于理想厨房)。
外围设备—又称为输入/输出设备(相当于配菜员和传菜生)。
1.三条总线
三条总线分别是数据总线(相当于材料传送带)、地址总线(相当于地址传送带)和控制总线(相当于控制传送带),负责中央处理单元、内存、外围设备之间的通信及数据传送。每一条总线都是由多根并排导线组成的。
2.内存
内存(相当于自动冰箱)负责(临时)存放将要运行的程序、程序运行需要的数据和程序运行得到的结果。
提示:程序和数据都以二进制位串的形式统一存放在内存中,这是冯·诺伊曼结构计算机的最为重要的特点。
从程序编写者的视角来看,内存是由很多同样大小的基本存储单元组成,随着计算机类型的不同,一台计算机的内存通常有几百个到几亿个基本存储单元。每个基本存储单元(相当于自动冰箱中的一个格子)都有一个唯一的、固定的(二进制非负整数)编号,这个编号称为地址。对于绝大多数现代计算机,在一个基本存储单元中,通常只能存放长度为一个字节的数据。参见图1-2。
一个数据(或一条指令)如果太长,在一个基本存储单元存放不下,就要用内存地址连续的相邻几个基本存储单元(组成一个更大的存储单元)来存放。
注意:存储单元中的变与不变
虽然存储单元的地址、存储单元中存放的程序、数据和信息都是二进制位串。但是,一个存储单元的地址是固定不变的,而这个存储单元中存放的位串是可以改变的。
延伸与拓展:计算机内部存储和传输数据的另一个常用单位—“字”
在计算机内部,还有一个与机器硬件性能密切相关的存取和传输数据的常用单位:字(word)。
一个“字”的长度到底是等于1个字节、2个字节、4个字节还是8个字节,与该计算机的数据总线的宽度(即组成一条数据总线的并排导线的根数)有关。比如,在数据总线宽度为32的计算机上,一个字长就是32位,它包含4(32/8=4)个字节。计算机执行一条指令就能存取和传输一个字长度的位串。
在现代计算机中,数据总线宽度通常等于8、16、32或64,并分别把这些计算机称为8位、16位、32位或64位计算机。数据总线的宽度是衡量一台计算机性能的一个重要指标。
在大多数早期计算机中,“字”的长度往往不是字节的倍数。而且,很多早期的计算机是以“字”作为内存基本存储单元的。
3.CPU
CPU(相当于理想厨房)负责通过三条总线到内存中去取(程序中的)指令(相当于菜谱中的加工步骤),并根据指令的要求对数据进行运算和处理以及进行相关的控制工作。
CPU中的主要部件有:控制单元(相当于厨房管理员)、算术逻辑单元(相当于厨师加炊具)和一些寄存器(相当于厨房中的碟子)。不同的CPU中会有十几个到几百个寄存器。
控制单元:负责(通过总线)从内存中得到指令、对取到的指令进行译码,并负责(通过总线)向相关部件发布执行指令的命令,控制单元是指令执行的控制中心。
算术逻辑单元(ALU):ALU是用来对数据进行基本运算的。负责根据指令的指示从内存单元(或寄存器)中得到数据、对数据进行指定的运算。ALU是计算机中的数据处理中心。
寄存器:控制单元中最重要的寄存器有三个:指令地址寄存器(又称为PC寄存器)、指令寄存器(又称为IR寄存器)、状态寄存器(又称为标志寄存器,相当于加工信息存放碟)。
PC寄存器中存放的是下一条将要执行的指令的(内存)地址。没有PC寄存器中的值,控制单元无法知道要执行的下一条指令位于内存的何处。
指令寄存器用来存放刚刚从内存中取来的、立即要执行的指令,便于控制单元对指令进行译码。
任何种类的CPU中,通常都有一个状态寄存器,它是用来自动存放一条指令执行后计算机和程序当前所处状态信息的,比如本次计算结果是否为零、是否溢出等。这类“是否”信息有多条,每一条信息使用状态寄存器中的某一个固定位来保存。
在CPU中通常都有一些通用寄存器,通用寄存器的功能与内存单元类似,用来临时存放一些算术逻辑单元要加工处理的数据。不过,算术逻辑单元到寄存器中存取数据比到内存存储单元中存取数据通常大约要快100倍。一个寄存器中通常可以存放长度为一个字的位串。
4.外围设备(相当于配菜员和和传菜生)
输入设备(比如,键盘、鼠标、麦克风、网线、数码相机、扫描仪等):负责将数据输送到计算机内部。
输出设备(比如,显示器的屏幕、打印机、音箱、网线):负责输出计算机内部的数据(通常是程序运行得到的结果)。
外存:计算机的RAM内存无法长期保存数据,一旦关机,RAM中的所有数据都将丢失,程序运行得到的结果可以保存到外存(硬盘、U盘和可读写光盘)中。外存也属于输入/输出设备。
不同计算机配置的外围设备的品种和数量可以大不相同。
延伸与拓展:输入/输出设备与计算机的连接方式
与内存、CPU不同的是,所有输入/输出(I/O)设备都是通过接口电路(或称为输入输出控制器)间接连接到计算机总线上的(例如,显示卡就是显示器的接口电路)。细节请参见第11章。
1.2.2 计算机系统中的软件
计算机软件是由程序(相当于菜谱)、数据(相当于炒菜加工的原材料)和一些辅助性的文档组成的。
程序是计算机系统中的一个无重量、无体积、不会损坏,但通常可以经常更换的极为重要的软件部件。程序是由一条条的指令顺序组成的。
任何类型计算机的任何一条指令,都是由两部分组成:操作码和操作数。在书写一条指令时,操作码位于一行的左边,操作数位于同一行的右边。
操作码指示计算机做一件什么事(计算机所能够做的、固定一些事中的某一件);操作数告知计算机对位于哪里的数据(或什么数据)做这件事(或者指出将计算结果存放到哪里去)。一条指令的操作数通常有0~3个。
一条指令所能够做的事通常都是极为简单的,一般只涉及一个到两个数据的基本运算(比如,加、减、乘、除等)、存数、取数、输入、输出和跳转等。
任何一条指令—包括操作码和操作数—都是由二进制位串构成的。比如,指令1100 10110111表示将内存地址为10110111中的数取出来与累加器(这是大多数CPU中具有的一个常用寄存器)中的数相加,结果存放在累加器中,1100表示做加法。
一台计算机能够执行的所有不同指令的(操作码的)集合称为指令集,通常计算机的指令集中—随着计算机类型的不同—有几十条到几百条指令不等。
不同类型计算机的指令集是不同的。比如,在一台计算机上用操作码1100表示做加法,而在另一台不同类型计算机上可能用操作码1011011表示做加法。
注意:一台计算机的指令集,本质上是计算机的设计者为计算机硬件设计制定的一张“编码解码表”。编码的对象是某一种类型计算机能够执行的(可以由人们通过编程来命令计算机做的)所有各种不同的基本操作。每一种基本操作都对应着该表中的一个编码,这个编码就是指令的操作码。
用某一类计算机指令集中的一些指令编写出来的完成一个特定数据处理任务的指令序列,称为机器语言程序。虽然指令集中的指令数量是有限的、固定的,但使用指令集中的有限种指令,可以编写出来的机器语言程序的数量却是无限的。就像用26个英文字母可以写出无限多篇文章一样。
机器语言程序是可以直接在计算机上运行的唯一一种程序。因为只有这种程序中的指令,才可以直接转变为计算机的数字电路中运行时所需要的驱动各条数字电路中的高低电平。
1.2.3 计算机指令所能做的工作
虽然每种类型计算机的指令集都不一样,但是,不同种类的计算机指令集中的常用指令类型却很相似。
任何类型计算机指令集中的指令,通常都可分为以下七大类型:
1)数值计算类指令:命令算术逻辑单元(ALU)对数据作一次基本运算。数值计算类指令是唯一一类能够通过计算加工数据得到结果的指令。基本运算包括:算术运算(加、减、乘、除)、逻辑运算(与、或、非)和位运算等。计算机的算术逻辑单元中的逻辑门电路实现这些基本运算的过程,请读者阅读相关参考文献。
2)取数指令:把指定内存地址的存储单元中的数据,取到(即复制到)CPU的某个寄存器中。此类指令的运行过程与硬件自动进行的取指令的操作过程很类似。
3)存数指令:把某个寄存器中的运算结果(或中间运算结果)送回到指定内存单元中存放。存数指令的执行将改变内存中此存储单元中的值。
4)数据移动指令:将一个寄存器中的数移动(即复制)到另一个寄存器中。但是,将一个数从一个内存单元移动(即复制)到另一个内存单元却要执行两条指令(取数指令和存数指令)。
5)跳转指令:这种指令的执行结果就是(或是在条件成立时)改变PC寄存器中的当前值,这使得计算机可以(在某个条件成立时)跳转到内存别的地方去开始顺序执行指令。
(条件)跳转指令是一类极为重要的指令,因为只有这一类指令能够根据不同情况让计算机执行不同的指令序列。一条有条件跳转指令是否执行,取决于状态寄存器中的某一位的值是真还是假。跳转指令是一类能够重组计算机工作流程的重要指令。
6)数据输入指令(命令输入设备输入一个数据):这种指令执行起来通常比取数据指令慢几个数量级。输入一个数据到计算机内部,都必须执行一条输入指令。输入指令的执行将改变内存中某个存储单元(或CPU中某个寄存器)的值。
7)数据输出指令(命令输出设备输出一个数据):这种指令执行起来通常也比存数指令慢几个数量级。从计算机内部输出一个数据,都必须执行一条输出指令。
还有一些更高级的计算机指令的类型,但这些指令通常都不是必需的。也就是说,更高级的一条指令所能做的事,通常都能够由这基本的七大类指令中的多条指令来取代。高级指令通常只是使得编程更高效或运行速度更快而已。
由以上的指令分类还可知:除了(在各部件之间)传送数据、进行数值计算、逻辑运算和(根据条件)进行跳转之外,计算机本质上没有任何别的能力,这也是“计算机”这个名称的由来。