填之前的坑，伪共享-51CTO.COM

[[435661]]

大家好，我是yes。

之前在写 FastThreadLocal 的时候，挖了个坑。

咳咳，时间过得有点久了，但是影响不大今天就来补上。

来谈谈什么是伪共享，并且为什么 Netty 要在这里移除这个优化?

话不多说，发车!

什么是伪共享?

这个名词听着有点高级的感觉，实际上很好理解。

我们都知道 CPU 的执行速度远大于从内存获取数据的速度，为了减少这个差距科研人员们就不断的研究，产出了高速缓存，但这个高速缓存由于工艺集成度问题，无法作为主存的介质，所以常见的 CPU 缓存结构如下图所示：

L1、L2、L3则为 CPU 和主存之间的高速缓冲区，距离 CPU 越近的缓存访问速度越快，且容量越小。

比如我笔记本的 CPU上：

访问速度：L1>L2>L3>主存。

L1 和 L2 是单核 CPU 独享的，当 CPU 访问数据的时候会先去 L1 上面找，找不到再去 L2，然后是 L3，最后是主存。所以当对一个数据重复计算的时候，应该尽量保证数据在 L1 中，这样效率才高。

从上面的结构来看，有经验的同学肯定会发现上面的结构有共享内存多线程的问题。这里就引入了一致性协议 MESI。具体协议内容这里不作展开，这里简单举例理解下：

当 cpu1 和 cpu3 共同访问主存里面的一个数据时，会分别获取放置到自己高速缓冲区中，当 cpu1 修改了这个数据之后，cpu3 的高速缓冲区中这个数据就失效了，它会让 cpu1 把这个改动刷新到主存中，然后自己再去主存加载这个数据，这样数据才会正确。

图中按序号顺序来阅读，应该不难理解。

然后重点来了，CPU 缓存的单位是缓存行，也就是说 CPU 从主存拿数据不是一个一个拿，是一行一行的拿，这一行的大小一般是 64 字节，那问题就来了。

比如，现在有个 long 数组，大小为 8 ，那刚好这个数组满足一行的大小。现在 cpu1 频繁更新long[0]的值，而 cpu3 频繁更新 long[5] 的值，这就有点麻了。

由于缓存行的机制，每次 cpu1 会把整个数组都加载到缓存中，每次仅修改 long[0] 也会使得这一行都变脏，此时 cpu3 访问的 long[5] 就失效了，因此 cpu3 需要让 cpu1 把修改刷新到主存中，然后它从主存重新获取 long[5] 再进行操作，假设此时 cpu1 又修改了 long[0]，则上面的操作就又得来一遍!