真实字节二面：什么是伪共享？-51CTO.COM

这个问题来自最近一个朋友字节面试碰到的，最后他也成功拿到了字节offer，这个问题我想可能挺多人不太清楚，所以想拿出来单独说一说。

好了，让我们进入正题。

什么是伪共享

首先大家都知道，随着CPU和内存的发展速度差异的问题，导致CPU的速度远远快于内存，所以一般现在的CPU都加入了高速缓存，就是常说的解决不同硬件之间的性能差异问题。

这样的话，很简单的道理，加入了缓存，就必然会导致缓存一致性的问题，由此，又引入了缓存一致性协议。(如果你不知道，建议去百度一下，这里不做展开)

CPU缓存，顾名思义，越贴近CPU的缓存速度越快，容量越小，造价成本也越高，而高速缓存一般可以分为L1、L2、L3三级缓存，按照性能的划分：L1>L2>L3。

而事实上，数据在缓存内部都是按照行来存储的，这就叫做缓存行。缓存行一般都是2的整数幂个字节，一般来说范围在32-256个字节之间，现在最为常见的缓存行的大小在64个字节。

所以，按照这个存储方式，缓存中的数据并不是一个个单独的变量的存储方式，而是多个变量会放到一行中。

我们常说的一个例子就是数组和链表，数组的内存地址是连续的，当我们去读取数组中的元素时，CPU会把数组中后续的若干个元素也加载到缓存中，以此提高效率，但是链表则不会，也就是说，内存地址连续的变量才有可能被放到一个缓存行中。

在多个线程并发修改一个缓存行中的多个变量时，由于只能同时有一个线程去操作缓存行，将会导致性能的下降，这个问题就称之为伪共享。

为什么只有一个线程能去操作?我们举个实际的栗子来说明这种情况：

假设缓存中有x,y两个变量，他们同时已经在不同的三级缓存之中。

这时有两个线程A和B同时去修改位于Core1和Core2的变量x和y。

如果线程A去修改Core1的缓存中的x变量，由于缓存一致性协议，Core2中对应的缓存了x变量的缓存行将会失效，他会被强制从主内存中重新去加载变量。

这样的话，频繁的访问主内存，缓存基本都失效了，将会导致性能的下降，这就是伪共享的问题。

如何避免?

既然已经知道了什么是伪共享，那么怎么避免这种情况的发生?

改变行存储的方式?想都别想了。

剩下可行的方法就是填充，如果这一行只有我这一个数据那不就好了吗?

确实就是这样，解决方式通常有以下两种。

字节填充

在JDK8之前，可以通过填充字节的方式来避免伪共享的问题，如下代码所示：

自定义填充

一般而言，缓存行有64字节，我们知道一个long是8个字节，填充5个long之后，一共就是48个字节。

而 Java 中对象头在32位系统下占用8个字节，64位系统下占用16个字节，这样填充5个long型即可填满64字节，也就是一个缓存行。

@Contented注解

JDK8以及之后的版本 Java 提供了sun.misc.Contended 注解，通过@Contented注解就可以解决伪共享的问题。

注解方式

使用@Contented注解后会增加128字节的padding，并且需要开启-XX:-RestrictContended选项后才能生效。

所以，通过以上两种方式你会发现，对象头大小和缓存行的大小都和操作系统位数有关，JDK的注解帮你解决了这个问题，所以推荐尽量使用注解的方式来实现。

虽然解决了伪共享问题，但是这种填充的方式也浪费了缓存资源，明明只有8B的大小，硬是使用了64B缓存空间，造成了缓存资源的浪费。

而且我们知道，缓存又小又贵，时间和空间的取舍要自己酌情考虑。

实际应用

在Java中提供了多个原子变量的操作类，就是比如AtomicLong、AtomicInteger这些，通过CAS的方式去更新变量，但是失败会无限自旋尝试，导致CPU资源的浪费。

为了解决高并发下的这个缺点，JDK8中新增了LongAdder类，他的使用就是对解决伪共享的实际应用。

LongAdder继承自Striped64，内部维护了一个Cell数组，核心思想就是把单个变量的竞争拆分，多线程下如果一个Cell竞争失败，转而去其他Cell再次CAS重试。

Striped64成员变量

解决伪共享的真正的核心就在Cell数组，可以看到，Cell数组使用了Contented注解。

在上面我们提到数组的内存地址都是连续的，所以数组内的元素经常会被放入一个缓存行，这样的话就会带来伪共享的问题，影响性能。

这里使用Contented进行填充，就避免了伪共享的问题，使得数组中的元素不再共享一个缓存行。

解决伪共享

好了，今天的内容就到这里，我是艾小仙，我的slogan还没想好，但是我们下次见。

本文转载自微信公众号「艾小仙」，可以通过以下二维码关注。转载本文请联系艾小仙公众号。