图解 CPU-Cache 一致性

商务办公
CPU把数据写入 Cache 之后,内存与 Cache中 对应的数据就不一致了,所以要在一定的时机要把 Cache 中的数据同步到内存中。

[[408474]]

本文转载自微信公众号「虚机」,作者cloud3。转载本文请联系虚机公众号。

 这是图解系列之CPU cache

本文接着说Cache的一致性

我是cloud3

[[408475]]

下面分析一下缓存一致性问题。

本文只讨论硬件的cache一致性机制,所以对软件来说是透明的。

首先来看Cache和内存保持一致性的两种写入方式

write through和write back

CPU把数据写入 Cache 之后,内存与 Cache中 对应的数据就不一致了,所以要在一定的时机要把 Cache 中的数据同步到内存中。

根据写操作后同步到内存的时机,Cache和内存同步的方法可分为write back和write through。

write through

CPU向cache写入数据时,同时也写入memory,使cache和memory的数据保持一致。

优点是简单,缺点是每次都要访问memory,速度比较慢。但是读数据时还是能够享受Cache带来的快速优点的。

write back

CPU向cache写入数据时,只是把更新的cache区标记一下(cache line 被标为dirty),并不同步写入memory。

只是在cache区要被刷入新的数据时,才更新memory。

优点是CPU执行的效率提高,缺点是实现起来技术比较复杂。

其中write back可以减少不必要的内存写入,减轻总线压力。现在大部分场景下,cache多采用write back的方式,本文的介绍都是基于write back的方式。

单核一致性

首先我们看一下单处理器情况下Cache和主存之间如何保持一致性。

读Cache:

写Cache:

如果是多处理器呢?

多处理器的一致性问题

举个例子吧,内存0x48处数据为0x20,处理器0和1都从0x48处读取内存数据到自己的Cache line中。

然后处理器0写Cache把0x48数据更新为0x10,处理器1读0x48自己Cache命中,返回了0x20。

出现两个处理器读到的内存数据不一致了!

那么多处理器如何解决缓存一致性问题呢?

多处理器的一致性方法

多处理器一般是采用基于总线监听机制的高速缓存一致性协议。包括写无效和写更新协议。另外还有基于目录的高速缓存一致性机制。

总线监听(Bus snooping)

总线监听(Bus snooping)机制由 Ravishankar 和 Goodman 在 1983 年提出。其工作原理是当一个CPU修改了cache块之后,此更改必须传播到所有拥有该Cache 块副本的Cache上。

所有的监听者会监视总线上的所有数据广播。如果总线上出现修改共享Cache块的事件,所有监听者会检查自己的Cache是否缓存有共享Cache块的副本。

如果缓存有该共享Cache块的副本,则监听者执行操作以确保缓存一致性。

这些操作可以是刷新或失效缓存块,根据缓存一致性协议更改缓存块状态。

两类总线监听协议

根据管理本地Cache块副本的方式,有两类总线监听协议:

写更新(Write-update)

写无效(Write-invalidate)。

写更新(Write-update)

当处理器写入Cache块时,其他Cache监听到后把自己Cache中的数据副本进行更新。该方法通过总线向所有缓存广播写入数据。它比写无效协议产生更大的总线流量,所有这种方式不常见。Dragon和firefly属于这一类协议。

写无效(Write-invalidate)

这是最常用的监听协议。当处理器写入Cache块时,其他Cache监听到后把自己Cache中的数据副本标记为无效状态。这样处理器只能读取和写入数据的一个副本,其他缓存中的副本都是无效的。

写直通无效协议、写一次协议、MSI、MESI、MOSI、MOESI、MESIF都属于写无效这一类协议。

下面以最为常用的MESI协议为例子分析写无效协议

MESI

MESI协议又叫Illinois协议,MESI,"M", "E", "S", "I"这4个字母代表了一个cache line的四种状态,分别是Modified,Exclusive,Shared和Invalid。

  • Modified (M)

cache line只被当前cache所有,并且是dirty的。

  • Exclusive (E)

cache line仅存在于当前缓存中,并且是clean的。

  • Shared (S)

cache line在其他Cache中也存在并且都是clean的。

  • Invalid (I)

cache line无效,即没有被任何Cache加载。

有一个著名的状态标记图:

这个状态标记图什么意思呢?

对同一个Cache line,

我标记它为是M时,你只能标记为I

我标记它为是E时,你只能标记为I

我标记它为是S时,你只能标记为S或I

我标记它为是I时,你能标记为MESI

MESI有一个状态机:

这个状态机什么意思呢?它显示了一种状态在出现什么Event时转换成哪一种状态,自己状态转换过程中要向总线上广播什么消息(这些消息会被其他Cache监听到)

下面的表是对这个状态机的详细说明:

举个例子:

某Cache上一个cache line的现在状态是Shared。

如果本地CPU对它Read hit,那它状态还是Shared。

如果本地CPU对它Write hit,那它的状态变为Modified,并在总线上广播它Invalidate。

如果监听到总线上的Read消息,那它的状态还是Shared。

如果监听到总线上的Invalidate消息,那它的状态变为Invalidate。

其他的状态转换也是类似的处理。

总线监听的优缺点

如果有足够的带宽,总线监听比基于目录的一致性机制更快,因为所有事务都是直接被所有处理器看到。

总线侦听的缺点是可扩展性有限。频繁监听缓存会导致与处理器的访问竞争,从而增加缓存访问时间和功耗。每个请求都必须广播到系统中的所有节点。这意味着总线带宽必须随着系统变大而增长。由于总线侦听不能很好地扩展,较大的缓存一致性NUMA系统倾向于使用基于目录的一致性协议。

基于目录(Directory-based)

基于目录的一致性方法中,缓存的Cache块副本信息被保存在称为目录的结构中。当处理器写入Cache块时,不会向所有Cache广播请求,而是先查询目录以检索具有该副本的Cache,再发送到特定的处理器。与总线监听相比,目录方法可以大量节省总线流量。

在NUMA系统中,通常选择基于目录(directory-based)的方式来维护Cache的一致性。

 

责任编辑:武晓燕 来源: 虚机
相关推荐

2021-02-05 08:00:48

哈希算法​机器

2024-04-10 10:34:34

Cache系统GPU

2020-07-20 08:30:37

算法哈希分布式系统

2019-10-11 23:27:19

分布式一致性算法开发

2017-07-25 14:38:56

数据库一致性非锁定读一致性锁定读

2019-10-16 00:06:08

CPU内存存储

2022-12-14 08:23:30

2019-10-24 10:42:00

CPU内存存储器

2023-08-14 08:10:33

CPU缓存RFO

2021-02-02 12:40:50

哈希算法数据

2020-10-26 19:25:23

CPU缓存Cache

2022-03-22 09:54:22

Hash算法

2022-10-19 12:22:53

并发扣款一致性

2020-05-12 10:43:22

Redis缓存数据库

2020-11-24 09:03:41

一致性MySQLMVCC

2021-02-04 06:30:26

Python编程语言

2023-11-20 08:10:55

处理器CPU缓存

2024-11-14 07:10:00

2021-06-22 10:22:08

业务IT一致性首席信息官

2016-12-19 18:41:09

哈希算法Java数据
点赞
收藏

51CTO技术栈公众号