直接映射缓存,全相联映射缓存,组相连映射与tag,index,offset的理解

简介: 直接映射缓存,全相联映射缓存,组相连映射与tag,index,offset的理解

知乎大佬的文章

tag,index,offset的理解

这篇文章并不是真正介绍这些缓存地址映射方法的实现,而是基于上面大佬的文章的一些可能不好理解的地方的一些个人的理解.

直接相联映射

我们一共有8行cache line,cache line大小是8 Bytes。所以我们可以利用地址低3 bits(如上图地址蓝色部分)用来寻址8 bytes中某一字节,我们称这部分bit组合为offset。同理,8行cache line,为了覆盖所有行。我们需要3 bits(如上图地址黄色部分)查找某一行,这部分地址部分称之为index。现在我们知道,如果两个不同的地址,其地址的bit3-bit5如果完全一样的话,那么这两个地址经过硬件散列之后都会找到同一个cache line。所以,当我们找到cache line之后,只代表我们访问的地址对应的数据可能存在这个cache line中,但是也有可能是其他地址对应的数据。所以,我们又引入tag array区域,tag array和data array一一对应。每一个cache line都对应唯一一个tag,tag中保存的是整个地址位宽去除index和offset使用的bit剩余部分(如上图地址绿色部分)。tag、index和offset三者组合就可以唯一确定一个地址了。因此,当我们根据地址中index位找到cache line后,取出当前cache line对应的tag,然后和地址中的tag进行比较,如果相等,这说明cache命中。如果不相等,说明当前cache line存储的是其他地址的数据,这就是cache缺失。在上述图中,我们看到tag的值是0x19,和地址中的tag部分相等,因此在本次访问会命中。由于tag的引入,因此解答了我们之前的一个疑问“为什么硬件cache line不做成一个字节?”。这样会导致硬件成本的上升,因为原本8个字节对应一个tag,现在需要8个tag,占用了很多内存。tag也是cache的一部分,但是我们谈到cache size的时候并不考虑tag占用的内存部分。

补充一个基本知识点:
一个地址访问要映射到Cache中,地址被分成三个字段:tag,set index,block offset。这样,通过一个物理地址就可以获取数据或指令在缓存中的位置(set, way, byte).
再补充一个基本知识点:
主存到缓存的地址映射是直接映射的,其实主存中指令所在的位置,也会被映射到缓存中的相对的位置上(当然会有偏移量)

对于上面的文字,其中比较容易混淆的就是offset,index,tag究竟是什么了(当然我相信你肯定能理解cache line).

我们以上面的八个块为例,每一个块(cache line)都包含了8Byte,你可以理解为它是一个8Byte的数组.

首先,CPU给出我们需要读取的指令的内存地址0x0654,对应二进制为:

0000 0110 01 010 100.

index

我们先取出第3bit-第5bit,也就是低3bit的旁边3位,这三位用于告诉我们应该去哪一个块中取得数据,图中给出的是"010",也就是十进制的2,代表的是我们应该从块下标为2的块(块下标从0开始)中可以得到这个指令.

tag

然后我们引入了一个tag标签,这个是地址中我们除去第6bit中的所有位用于制成tag标签,之后我们根据tag匹配是否当前这个块中有我们需要的数据,他会与内存地址中的tag标签进行比较,如果相同那么就进行下一步,否则说明这次未命中.

offset

我们取出该地址的低3bit,也就是"100",对应十进制为4,代表的是指令会出现在某一块中的索引为4的位置.至此我们就找到了我们需要的数据.

写回法

根据上图可以发现我们所找到的块中的数据与tag不匹配,并且原有的块的下标的Dirty位已经被置位位1,说明这个数据之前已经被修改过,因此我们需要将这个数据先写入到指定位置中(0x0128)这里我不理解为什么是0x0128,有理解的可以私信我或者评论.

之后由于未命中的问题,需要把主存中从0x28开始的数据直接映射到这个块中.


相关文章
|
缓存 算法 Unix
《现代体系结构上的UNIX系统:内核程序员的对称多处理和缓存技术(修订版)》——2.7 n路组相联高速缓存的总结
正如现在所看到的那样,从直接映射到全相联的所有高速缓存组织结构都遵循着相同的组成原则:每一种组织结构都有一种用于选择搜索行的算法,每一种组织结构都有一种替换算法,每一种组织结构都可以使用写直通或者写回策略,而主要的区别则在于每一组内行数的不同。
1789 0
|
缓存 Unix 程序员
《现代体系结构上的UNIX系统:内核程序员的对称多处理和缓存技术(修订版)》——2.6 全相联高速缓存
在高速缓存内,组的大小可以增加到使组内的行数等于高速缓存内的全部行数。此时的高速缓存就称为全相联高速缓存(fully associative cache)。在全相联高速缓存中只有一组,它包含高速缓存中所有的行。不需要散列计算或者索引机制,因为只有一组要检查。
1465 0
|
缓存 算法 Unix
《现代体系结构上的UNIX系统:内核程序员的对称多处理和缓存技术(修订版)》——2.5 n路组相联高速缓存
用于这些高速缓存的散列算法和双路组相联高速缓存所采用的散列算法是相同系列的:使用取模散列函数(modulo hashing function),该函数采用的位数等于组数以2为底的对数值。
1401 0
|
缓存 算法 Unix
《现代体系结构上的UNIX系统:内核程序员的对称多处理和缓存技术(修订版)》——2.4 双路组相联高速缓存
在同一组内,每一行高速缓存都有它自己的标记,这意味着高速缓存可以同时保存经散列算法算出相同索引的两个不同地址的数据。Intel Pentium的片上数据高速缓存就是双路组相联高速缓存。它总共保存有8 KB的数据,每行32字节。
1671 0
|
13天前
|
canal 缓存 NoSQL
Redis缓存与数据库如何保证一致性?同步删除+延时双删+异步监听+多重保障方案
根据对一致性的要求程度,提出多种解决方案:同步删除、同步删除+可靠消息、延时双删、异步监听+可靠消息、多重保障方案
Redis缓存与数据库如何保证一致性?同步删除+延时双删+异步监听+多重保障方案
|
1月前
|
缓存 NoSQL Redis
【Azure Redis 缓存】Redission客户端连接Azure:客户端出现 Unable to send PING command over channel
【Azure Redis 缓存】Redission客户端连接Azure:客户端出现 Unable to send PING command over channel
|
1月前
|
缓存 NoSQL 网络协议
【Azure Redis 缓存】Lettuce 连接到Azure Redis服务,出现15分钟Timeout问题
【Azure Redis 缓存】Lettuce 连接到Azure Redis服务,出现15分钟Timeout问题
【Azure Redis 缓存】Lettuce 连接到Azure Redis服务,出现15分钟Timeout问题
|
30天前
|
缓存 NoSQL Java
Redis深度解析:解锁高性能缓存的终极武器,让你的应用飞起来
【8月更文挑战第29天】本文从基本概念入手,通过实战示例、原理解析和高级使用技巧,全面讲解Redis这一高性能键值对数据库。Redis基于内存存储,支持多种数据结构,如字符串、列表和哈希表等,常用于数据库、缓存及消息队列。文中详细介绍了如何在Spring Boot项目中集成Redis,并展示了其工作原理、缓存实现方法及高级特性,如事务、发布/订阅、Lua脚本和集群等,帮助读者从入门到精通Redis,大幅提升应用性能与可扩展性。
58 0
|
1月前
|
缓存 NoSQL Redis
【Azure Redis 缓存】使用StackExchange.Redis,偶发ERROR - Timeout performing HSET (15000ms)
【Azure Redis 缓存】使用StackExchange.Redis,偶发ERROR - Timeout performing HSET (15000ms)
|
1月前
|
缓存 NoSQL Java
【Azure Redis 缓存】示例使用 redisson-spring-boot-starter 连接/使用 Azure Redis 服务
【Azure Redis 缓存】示例使用 redisson-spring-boot-starter 连接/使用 Azure Redis 服务