408王道计算机组成原理强化——中央处理器及大题解构(下)

简介: 408王道计算机组成原理强化——中央处理器及大题解构

7.真题4e065ac68c684ec281ff94faf85c4f86.pngimage.png

(1)①可见:通用寄存器(R0 - R3),PC

不可见:MAR,MDR,IR,T,移位寄存器

②在单总线结构下,总线只能在同一时刻提供一个输入,而ALU需要同时有两个输入,故需要将一个数据先输入到暂存寄存器中,然后通过暂存寄存器和总线各输入一个数据的方式满足ALU两个输入的要求

(2)①ALU支持七种操作,故需要至少3位的控制信号,即ALUop至少为3位

②SR支持三种操作,故需要至少2位的控制信号,即SRop至少为2位

(3)三态门:作用是控制移位寄存器和总线之间的数据通路是否连通

(4)①:控制移位寄存器和总线之间的数据通路是否连通

②:控制移位寄存器进行何种操作

③:控制ALU进行何种操作

⑤:控制T和总线之间的数据通路是否连通

⑧:控制MUX的0还是1端口选通

(5)取值阶段:(PC)→ MAR;M(MAR)→ MDR;(MDP)op→IR


1054c5e30b5041d389dc5fff7fc8a4dc.png

PC + 2(指令字长为16位,按字节编码,故PC + "1" = PC + 2) :PC先经过总线输入到T中,然后通过MUXop = 0使op = 0,再给ALU施加加法命令,得到PC + 2再输入回PC中

进行其他运算时,一个数据先放在T中,然后从T输入ALU,另一个数据经过多路选择器(MUXop = 1)输入ALU

3da1518af13b460bb95669e40065f14e.png

⑥→⑨

⑦→④

e4d48295570043b9a8b142fb3efb3a3a.pngf4d4971854614ad5b1b2c908534b3a39.pngd25d470b07444c1ab62e31f26b5311e7.png

(1)①寻址方式位分别为0/1:Md、Ms1、Ms2都为1bit

②寄存器有4个:Rd、Rs1、Rs2为2bit

③指令字长为16bit → OP = 16 - 3 * (1 + 2) = 7 → 最多可以定义 2 ^ 7 = 128条指令

(2)①OP为7bit,则操作码分别取后七位,最高位舍去:000 0001,000 0010,000 0011

②inc:0000 001(OP)0(直接寻址)01(R1)000 000(单地址指令)

shl:0000 010(OP)0(直接寻址)10(R2)0(直接寻址)01(R1)000(二地址指令)

sub:0000 011(OP)0(直接寻址)11(R3)1(间接寻址)01(R1)0(直接寻址)10(R2)

即0240H、0488H、06EA

(3)①取值阶段:((PC))→IR(即将PC所指的指令,取到IR中);PC + "1"

第一步:PCout = 1,MARin = 1,Tin = 1,MEMop = read:PC中的数据输入到总线中,MAR和T同时读入PC的数据,并且对主存进行读操作(完成以PC值为地址取值,并PC+"1"做准备)

第二步:MUXop = 0,ALUop = add,SRop  = mov:T寄存器中的内容和MUX0端一起输入ALU的两端,同时将SR的操作设置为直送(实现PC + "1")

第三步:SRout = 1,PCin = 1:将SR寄存器中的内容输出到总线中,并输入PC

第四部:MDRout = 1,IRin = 1:将从主存中取出的指令从MDR输入IR中

②执行阶段:shl R2,R1

第一步:R1out = 1,Tin = 1,ALUop = mova,SRop = left:先将R1寄存器中的数据经过总线输入到T寄存器中,给ALU一个直送的控制信号(即不对数据进行处理,因为题中的ALU没有左移功能),数据经过ALU到了SR后,SR对该数据进行左移处理

第二步:SRout = 1,R2in = 1:将SR中的数据经过总线输入R2寄存器中

执行阶段:sub R0、R2,R1

第一步:R1out = 1,MARin = 1,MEMop = read:寄存器间接寻址,将R1中的内容作作为地址,放入MAR中,再读取该地址的数据

第二步:R2out = 1,Tin = 1:将R2寄存器中的数据经过总线输入到T寄存器中(ALU的计算需要两个输入)

第三步:MDRout = 1,MUXop = 1,ALUop = sub,SRop = mov,SRout = 1,R0in =1:第一步根据R1地址从主存读入的数据存放在MDR中;MDR中的数据经过总线输入到MUX中,MUX的1端连通,故数据经过MUX和T寄存器中的数据一起输入ALU;给ALU一个sub控制信号,使其进行减法操作,结果输出到SR中;给SRmov的控制信号,使其不对数据进行任何处理,并通过总线输入到R04c3fb286b9394e658d2dbf6cbf8fffc6.pngbe48f3be3bc4433396ffd546dcfcab4c.png

C5:(R1)→ MAR        R1out,MARin        

C6:M(MAR)→ MDR        MemR,MDRinE

C7:(MDR)→ A        MDRout,Ain

C8:(R0)+(A)→ AC        R0out,ADD,Cin

C9:(AC)→ MDR        ACout,MDRin

C10:(MDR)→ M(MAR)        MemW,MDRoutE3e916a91b3a64df18e84e2fcd6c92124.png224d195cdfb049bca7a68a3b6ae6ccd0.png

(1)①16位定长指令字格式 + 下条指令地址为(PC)+ 2 :按字节编址

②OFFSET用补码表示,8bit补码的表示范围为-128到+127,目标地址为2 * OFFSET,即OFFSET的值就代表其偏移的指令条数,而PC每次执行后会自动指向下一条指令,故最多可以向后偏移128 - 1 = 127条指令

(2)①NF = 1,则需要检查NF的值,而指令中NF的值为1,故需要发生转移,OFFSET的值为1110 0011,即E3H,负数符号扩展后为FFE3H,乘以二即左移1位 = FFC6H,故PC = 200CH + 0002H + FFC6H = 1FD4H

②CF = 1,则需要检查CF的值,而该指令中CF的值不为1,则不需要发生转移,故PC = 200CH + 0002H = 200EH

(3)无符号数比较小于等于即发生借位或者等于0,故检查CF和ZF,故C = 1,Z = 1 ,N = 0

(4)1.①中由OP、CF、ZF、NF、OFFSET组成,与指令的组成部分一致,故①是指令寄存器

2.每条指令的执行结果有两种:PC + 2和PC + 2 + OFFSET * 2,这两种结果的输出分别是多路选择器左端和右端的输出(通过IR寄存器C、Z、N位和标志寄存器输出的CF、ZF、NF相与得到多路选择器的控制信号,即选择多路选择器的哪个端口输出):

右端:PC输出在加法器的右端,在经过加法器后,和加法器左端的2进行加法操作,得到PC + 2

故右端的输出为PC + 2 + OFFSET * 2:在经过③前已经得到了PC + 2,还需要OFFSET * 2,故②为移位寄存器,实现移位操作,即通过左移得到OFFSET * 2;③为加法器,实现PC + 2和OFFSET * 2的相加,得到左端的最终输出PC + 2 + OFFSET * 29cd38198296945d8bbb65a7023123bff.png1ab803a2dc0d4bb3959503a18bda99fe.png

①(R2)<< 2 → R4:R2寄存器中存放的是变量i,变量i左移2位,即变量i = i * 4,再将结果放回R4中;该指令的作用是得到A[i]的相对于A[0]的地址偏移量;从此处可知,数组A的每个元素的单位大小为4B

②(R4)+(R3)→ R4:R3寄存器存放的是数组A的首地址,R4寄存器存放的是A[i]地址相对于数组A的首地址的偏移量,两者相加得到A[i]的地址;A[i] = 始址 + 下标 * 元素大小

③((R4)+ 0)→ R5:R4寄存器存放的是A[i]的地址,根据此地址从主存中取出数据,即取出数组A的第i个元素放入R5中

④(R1)+(R5)→ R1:R1寄存器存放的是当前A数组前i - 1个元素总和的变量sum,R1 + R5得到数组A前i个元素的和,并结果放回R1中,即完成sum += A[i]

⑤(R2)+ 1 → R2:R2寄存器存放的是每轮i的取值,即完成i++

⑥if(R2)! = (R6)goto loop:R6寄存器存放的是变量N,即判断R2和R6是否满足循环结束的条件,若不满足,则跳转回LOOP处执行指令;若满足则,顺序执行指令,即实现for循环

(1)每行的机器代码是4B,每行指令地址相差4,故编制单位为字节

(2)①②③的作用是得到A[i]的地址,在①中i左移两位即i = i * 4,说明每个元素占用4B

(3)①bne指令为1446 FFFAH,根据指令格式可知末尾2B为OFFSET,FFFA = -6,即该指令实现向后偏移6个单位

②根据bne指令的地址0804 8114H和LOOP地址0804 8100H对比可知,该OFFSET的单位并不是字节,而

③oop指令和bne指令相差5个指令,PC在执行bne指令时实现PC + “1”,即指向bne的下条指令,故执行bne指令时,loop的地址和PC的值相差6个指令,满足向后偏移6个单位,可知OFFSET的单位是指令字长

④得到bne指令的转移目标地址计算公式:PC + 4 + (OFFSET * 4)::PC + 4实现指向PC + "1",OFFSET * 4表示按指令字长为单位进行偏移

(4)①(R2)<< 2 → R4:结果写回R4

②(R4)+(R3)→ R4:①写入R4,②读出R4,但②是①的相邻第一条指令,数据冒险

③((R4))+ 0 → R5:②写入R4,③读出R4,但③是②的相邻第一条指令,数据冒险

④(R1)+(R5)→ R1:③写入R5,④读出R5,但④是③的相邻第一条指令,数据冒险

⑤(R2)+ 1 → R2:①写入R2,⑤读出R2,⑤不是①的相邻三条指令其中之一,不会数据冒险

⑥if(R2)!= (R6)goto loop:⑤写入R2,⑥读出R2,但⑥是⑤的相邻指令,数据冒险

故②③④⑥发生数据冒险

⑥只有转移指令才会发生控制冒险,只有⑥为条件转移指令,故⑥发生控制冒险

分支指令(bxxx,ARM架构下的条件转移指令)的执行均引起3个时钟周期(停三个时钟周期)的阻塞,故执行⑥后,将会阻塞三个时钟周期,而不管是有条件转移指令还是无条件转移指令,至多只需要停三个时钟周期就不会发生阻塞,满足不阻塞条件

(5)①loop指令可以完整的执行IF、ID、EX、M、WB五个周期(第一条指令)

②add指令的IF阶段因为loop指令并不是条件转移指令,故不会发生控制冒险,即PC发生除+"1"外的改变,可以正常执行IF阶段;ID阶段需要取出R4的内容,但是loop指令在WB阶段会改变R4的内容,因此需要等待直到loop执行执行完WB阶段add指令才能继续执行ID阶段;EX、M、WB阶段按顺序执行

③load指令的IF阶段因为在第三个机器周期时,add指令并没有入时进入ID阶段,故IF阶段的IR寄存器中存放的是待进入ID阶段的add指令如果此时load指令进入IF阶段,则将会覆盖IR寄存器中的add指令,因此load指令需要等待add指令进入ID阶段后,才能进入自己的IF阶段;同理②,load指令也需要等待add完成WB阶段后,才能进入ID阶段

④同理③,add指令需要等待load指令进入ID阶段才能进入自己的IF阶段;add指令需要等待load指令完成WB阶段才能进入自己的ID阶段;

⑤add指令需要等待add指令进入ID阶段才能进入自己的IF阶段;但其ID阶段并不会产生数据冒险,故可以顺序执行

⑥add指令可以顺序执行IF、ID,故bne指令可以在add指令执行完IF的下一个时钟周期执行自己的IF阶段,在执行IF阶段时,计算机只是完成了取指令的操作,并不知道当前取的指令是条件转移指令;其ID阶段需要等待add指令的WB阶段完成才能开始(数据冒险),在执行ID阶段时,计算机知道当前执行的是条件转移指令,根据题目所给的条件,执行分支指令时,阻塞三个时钟周期,故ID阶段开始阻塞三个时钟周期;bne指令的第四个周期(M)可能会修改自己的PC值,下条指令开始前,通过阻塞三个时钟周期的方式,已经执行了bne指令的M阶段,故不会引起控制冒险d3636c02fdda4d338b41b5b254f7d490.png

相关文章
|
算法 网络虚拟化 内存技术
408王道计算机组成原理强化——存储系统大题
408王道计算机组成原理强化——存储系统大题(下)
2212 2
408王道计算机组成原理强化——存储系统大题
408王道计算机组成原理强化——输入输出系统大题(I/O)
408王道计算机组成原理强化——输入输出系统大题(I/O)
382 1
408王道计算机组成原理强化——输入输出系统大题(I/O)
|
4月前
深挖计算机的根:汇编语言与计算机架构之间不可告人的秘密
【8月更文挑战第31天】本文深入探讨了汇编语言与计算机架构之间的重要联系。通过解析汇编语言的基本概念及其与硬件的直接映射关系,文章展示了它在计算机体系中的独特地位。以一个简单的“Hello, World!”汇编程序为例,详细说明了汇编语言如何操作底层硬件。尽管现代软件开发中较少使用汇编语言,但掌握它有助于理解计算机工作原理,对于性能优化和系统编程至关重要。
49 2
|
6月前
|
数据挖掘
计算机在生活中的作用
计算机在生活中的作用
113 0
|
6月前
|
存储 知识图谱
【计算机组成原理】指令系统&考研真题详解之拓展操作码!
也就是说 “其中三地址指令29”条这句话,完全可以翻译成“三地址这种类型的指令一共能有29种不同的可能性” 这样说就清晰多 因为这就意味着 我们需要用若干个字节 来表示这29种不同的可能性 然后又已知每一个字节位能表示的可能性是2种(0/1),那么我们想有多少个字节可以表示29种不同的可能呢?最少5种 (因为2的4次方=16<29),2^5=32>29,也就是说有32-29=3种可能性是不在三地址指令这种类型的指令集里面的,所以这3 种余出来的可能性要被利用 就在下一种 “二地址指令集”中利用到
86 0
|
存储
计算机组成原理:计算机的体系与结构
本文介绍早期计算机、冯·诺依曼体系结构和现代计算机结构。
215 0
计算机组成原理:计算机的体系与结构
|
内存技术
408王道计算机组成原理强化——中央处理器及大题解构(上)
408王道计算机组成原理强化——中央处理器及大题解构
698 1
408王道计算机组成原理强化——中央处理器及大题解构(上)
|
存储 程序员
408王道计算机组成原理强化——指令系统及大题解构(下)
408王道计算机组成原理强化——指令系统及大题解构
288 1
408王道计算机组成原理强化——指令系统及大题解构(下)
|
编译器
408王道计算机组成原理强化——指令系统及大题解构(上)
408王道计算机组成原理强化——指令系统及大题解构
272 1
408王道计算机组成原理强化——指令系统及大题解构(上)
408王道计算机组成原理强化——数据的运算及大题(下)
408王道计算机组成原理强化——数据的运算及大题
522 1
408王道计算机组成原理强化——数据的运算及大题(下)