真实字节二面:什么是伪共享?

简介: 这个问题来自最近一个朋友字节面试碰到的,最后他也成功拿到了字节offer,这个问题我想可能挺多人不太清楚,所以想拿出来单独说一说。好了,让我们进入正题。

什么是伪共享

首先大家都知道,随着CPU和内存的发展速度差异的问题,导致CPU的速度远远快于内存,所以一般现在的CPU都加入了高速缓存,就是常说的解决不同硬件之间的性能差异问题。

这样的话,很简单的道理,加入了缓存,就必然会导致缓存一致性的问题,由此,又引入了缓存一致性协议。(如果你不知道,建议去百度一下,这里不做展开)

CPU缓存,顾名思义,越贴近CPU的缓存速度越快,容量越小,造价成本也越高,而高速缓存一般可以分为L1、L2、L3三级缓存,按照性能的划分:L1>L2>L3。

594bb59463a403664cc67d1bd6e0ead1.jpg

而事实上,数据在缓存内部都是按照来存储的,这就叫做缓存行。缓存行一般都是2的整数幂个字节,一般来说范围在32-256个字节之间,现在最为常见的缓存行的大小在64个字节。

所以,按照这个存储方式,缓存中的数据并不是一个个单独的变量的存储方式,而是多个变量会放到一行中。

我们常说的一个例子就是数组和链表,数组的内存地址是连续的,当我们去读取数组中的元素时,CPU会把数组中后续的若干个元素也加载到缓存中,以此提高效率,但是链表则不会,也就是说,内存地址连续的变量才有可能被放到一个缓存行中

在多个线程并发修改一个缓存行中的多个变量时,由于只能同时有一个线程去操作缓存行,将会导致性能的下降,这个问题就称之为伪共享

为什么只有一个线程能去操作?我们举个实际的栗子来说明这种情况:

假设缓存中有x,y两个变量,他们同时已经在不同的三级缓存之中。

这时有两个线程A和B同时去修改位于Core1和Core2的变量xy

如果线程A去修改Core1的缓存中的x变量,由于缓存一致性协议,Core2中对应的缓存了x,y变量的缓存行将会失效,他会被强制从主内存中重新去加载变量。

这样的话,频繁的访问主内存,缓存基本都失效了,将会导致性能的下降,这就是伪共享的问题。

e814e0b0637b070d3e3e68aac7ff851e.jpg

如何避免?

既然已经知道了什么是伪共享,那么怎么避免这种情况的发生?

改变行存储的方式?想都别想了。

剩下可行的方法就是填充,如果这一行只有我这一个数据那不就好了吗?

确实就是这样,解决方式通常有以下两种。

字节填充

在JDK8之前,可以通过填充字节的方式来避免伪共享的问题,如下代码所示:

86741ca6eea21bf0be0e840482179f0d.jpg

自定义填充

一般而言,缓存行有64字节,我们知道一个long是8个字节,填充5个long之后,一共就是48个字节。

而 Java 中对象头在32位系统下占用8个字节,64位系统下占用16个字节,这样填充5个long型即可填满64字节,也就是一个缓存行。

@Contented注解

JDK8以及之后的版本 Java 提供了sun.misc.Contended 注解,通过@Contented注解就可以解决伪共享的问题。

9fa322a5d65dba42fa97a509e020127c.jpg

注解方式

使用@Contented注解后会增加128字节的padding,并且需要开启-XX:-RestrictContended选项后才能生效。

所以,通过以上两种方式你会发现,对象头大小和缓存行的大小都和操作系统位数有关,JDK的注解帮你解决了这个问题,所以推荐尽量使用注解的方式来实现。

虽然解决了伪共享问题,但是这种填充的方式也浪费了缓存资源,明明只有8B的大小,硬是使用了64B缓存空间,造成了缓存资源的浪费。

而且我们知道,缓存又小又贵,时间和空间的取舍要自己酌情考虑。

实际应用

在Java中提供了多个原子变量的操作类,就是比如AtomicLongAtomicInteger这些,通过CAS的方式去更新变量,但是失败会无限自旋尝试,导致CPU资源的浪费。

为了解决高并发下的这个缺点,JDK8中新增了LongAdder类,他的使用就是对解决伪共享的实际应用。

LongAdder继承自Striped64,内部维护了一个Cell数组,核心思想就是把单个变量的竞争拆分,多线程下如果一个Cell竞争失败,转而去其他Cell再次CAS重试。

0ad5e312d664a89b996faa8fe66b59f5.jpg

Striped64成员变量

解决伪共享的真正的核心就在Cell数组,可以看到,Cell数组使用了Contented注解。

在上面我们提到数组的内存地址都是连续的,所以数组内的元素经常会被放入一个缓存行,这样的话就会带来伪共享的问题,影响性能。

这里使用Contented进行填充,就避免了伪共享的问题,使得数组中的元素不再共享一个缓存行。

e0cdcda19c2ab21bf12acd719416ec92.jpg

解决伪共享

好了,今天的内容就到这里,我是艾小仙,我的slogan还没想好,但是我们下次见。

相关文章
|
6月前
|
存储 缓存 安全
故事会【伪共享】
故事会【伪共享】
|
存储 缓存 Oracle
常识四堆外内存
常识系列,作为一名互联网门外汉的科普系列 堆外内存除了在像netty开源框架中,在平常项目中使用的比较少,在现前的项目中,QPS要求高的系统中,堆外内存作为其中一级缓存是相当有成效的。所以来学习一下,文中主要涉及到这三分部内容 1. 堆外内存是什么?与堆内内存的区别 2. 怎么分配,与GC的影响 3. 开源框架使用 这篇文章写到最后,发现还只是回答了开源框架OHC的Why not use ByteBuffer.allocateDirect()?
1273 1
常识四堆外内存
|
5月前
|
存储 算法 程序员
【OSTEP】超越物理内存:机制 | 请求分页 | 交换位与存在位 | 页错误
【OSTEP】超越物理内存:机制 | 请求分页 | 交换位与存在位 | 页错误
30 0
|
8月前
|
缓存
每天一道面试题-CPU伪共享
每天一道面试题-CPU伪共享
38 0
|
6月前
|
小程序 IDE JavaScript
小程序是一种伪需求技术吗?
小程序是一种伪需求技术吗?
40 0
|
7月前
|
存储
一篇文章让你搞懂浮点数在内存中的存储机制[保姆级教学]
一篇文章让你搞懂浮点数在内存中的存储机制[保姆级教学]
|
11月前
|
存储 C语言
内存的读写过程、现实模型及指针
内存的读写过程、现实模型及指针
114 0
内存的读写过程、现实模型及指针
|
12月前
|
测试技术
字符串a和他许久未见面的同父异母的b(模拟)(思维)
字符串a和他许久未见面的同父异母的b(模拟)(思维)
59 0
|
缓存 Java 程序员
面试官:什么是伪共享,如何避免?
在前面的文章里,我们聊到了 CPU 的高速缓存机制。由于 CPU 和内存的速度差距太大,现代计算机会在两者之间插入一块高速缓存。 然而,CPU 缓存总能提高程序性能吗,有没有什么情况 CPU 缓存反而会成为程序的性能瓶颈?这就是我们今天要讨论的伪共享(False Sharing)。
194 0
|
Unix Linux Shell
大家常说的 32 位与 64 位 电脑啥概念?
在通用PC领域,不论是windows还是linux界,我们都会经常听到"32位"与"64位"的说法,类似的还有"x86"与"x86_64","i386"与"amd64",这两组概念之间有着怎样的联系和区别呢?实际上这两组概念涉及了三个层次:硬件,系统和软件。
119 0
大家常说的 32 位与 64 位 电脑啥概念?