这篇文章并不是真正介绍这些缓存地址映射方法的实现,而是基于上面大佬的文章的一些可能不好理解的地方的一些个人的理解.
直接相联映射
我们一共有8行cache line,cache line大小是8 Bytes。所以我们可以利用地址低3 bits(如上图地址蓝色部分)用来寻址8 bytes中某一字节,我们称这部分bit组合为offset。同理,8行cache line,为了覆盖所有行。我们需要3 bits(如上图地址黄色部分)查找某一行,这部分地址部分称之为index。现在我们知道,如果两个不同的地址,其地址的bit3-bit5如果完全一样的话,那么这两个地址经过硬件散列之后都会找到同一个cache line。所以,当我们找到cache line之后,只代表我们访问的地址对应的数据可能存在这个cache line中,但是也有可能是其他地址对应的数据。所以,我们又引入tag array区域,tag array和data array一一对应。每一个cache line都对应唯一一个tag,tag中保存的是整个地址位宽去除index和offset使用的bit剩余部分(如上图地址绿色部分)。tag、index和offset三者组合就可以唯一确定一个地址了。因此,当我们根据地址中index位找到cache line后,取出当前cache line对应的tag,然后和地址中的tag进行比较,如果相等,这说明cache命中。如果不相等,说明当前cache line存储的是其他地址的数据,这就是cache缺失。在上述图中,我们看到tag的值是0x19,和地址中的tag部分相等,因此在本次访问会命中。由于tag的引入,因此解答了我们之前的一个疑问“为什么硬件cache line不做成一个字节?”。这样会导致硬件成本的上升,因为原本8个字节对应一个tag,现在需要8个tag,占用了很多内存。tag也是cache的一部分,但是我们谈到cache size的时候并不考虑tag占用的内存部分。
补充一个基本知识点:
一个地址访问要映射到Cache中,地址被分成三个字段:tag,set index,block offset。这样,通过一个物理地址就可以获取数据或指令在缓存中的位置(set, way, byte).
再补充一个基本知识点:
主存到缓存的地址映射是直接映射的,其实主存中指令所在的位置,也会被映射到缓存中的相对的位置上(当然会有偏移量)
对于上面的文字,其中比较容易混淆的就是offset,index,tag究竟是什么了(当然我相信你肯定能理解cache line).
我们以上面的八个块为例,每一个块(cache line)都包含了8Byte,你可以理解为它是一个8Byte的数组.
首先,CPU给出我们需要读取的指令的内存地址0x0654,对应二进制为:
0000 0110 01 010 100.
index
我们先取出第3bit-第5bit,也就是低3bit的旁边3位,这三位用于告诉我们应该去哪一个块中取得数据,图中给出的是"010",也就是十进制的2,代表的是我们应该从块下标为2的块(块下标从0开始)中可以得到这个指令.
tag
然后我们引入了一个tag标签,这个是地址中我们除去第6bit中的所有位用于制成tag标签,之后我们根据tag匹配是否当前这个块中有我们需要的数据,他会与内存地址中的tag标签进行比较,如果相同那么就进行下一步,否则说明这次未命中.
offset
我们取出该地址的低3bit,也就是"100",对应十进制为4,代表的是指令会出现在某一块中的索引为4的位置.至此我们就找到了我们需要的数据.
写回法
根据上图可以发现我们所找到的块中的数据与tag不匹配,并且原有的块的下标的Dirty位已经被置位位1,说明这个数据之前已经被修改过,因此我们需要将这个数据先写入到指定位置中(0x0128)这里我不理解为什么是0x0128,有理解的可以私信我或者评论.
之后由于未命中的问题,需要把主存中从0x28开始的数据直接映射到这个块中.