HTTP 缓存策略:强缓存和协商缓存

存储 数据管理
缓存(Cache)是一种数据存储技术,广泛应用在电脑工程领域。

大家好,我是前端西瓜哥。今天讲一下 HTTP 缓存策略的强缓存和协商缓存。

缓存是什么?

缓存(Cache)是一种数据存储技术,广泛应用在电脑工程领域。

它将原本访问起来较慢的数据,放到访问更快的存储介质中,当第二次访问时,能够更快地访问数据,是一种 空间换时间 的做法。

比如,有个文件经常被读取,且很少改变,那我们就直接将其缓存到内存中,节省掉耗时的 IO 磁盘读取时间。

再比如,在写代码时,我们的一个方法会接受参数,然后计算返回一个结果,假设这个计算过程非常耗时,且结果值只依赖传入的参数。

那我们就可以将参数和结果的对应映射,保存到哈希表中,下次如果是相同参数,就能命中然后直接从哈希表里获取,速度有了极大提升。

HTTP 缓存也是一样的道理,用户通过 HTTP 请求访问的资源会缓存到本地,在用户第二次访问相同资源时,直接使用之前缓存的资源。

当然资源可能并不一定是不变的,在必要的时候需要更新缓存。为此我们可能需要设置一下缓存的有效期,或是发送一个占用带宽小的请求询问服务端等等。

这些,就是 HTTP 缓存策略。

强缓存

强缓存,指的是 让浏览器强制缓存服务端提供的资源。

“东西就给你了,没事别找我。”

Cache-Control: max-age=<seconds>

响应头字段 Cache-Control,通过设置 max-age=<seconds>,可以规定资源的缓存有效时间长度,单位为秒。

需要注意的是 Cache-Control 是通用头字段,请求头和响应头中都可以使用。

响应头字段的 Cache-Control 用于告知客户端如何缓存资源。

客户端的 Cache-Control 则是告知服务器需要多新鲜的资源,比如 no-cache 或 max-age=0 表示要最新鲜的资源。

Cache-Control: max-age=31536000

在浏览器 devtool 的 network 面板,我们看到 from disk cache 的字样,代表这个资源并没有去发送请求,而是使用了来自硬盘的缓存。

如果你不停地刷新页面,你还会看到 from memory cache :来自内存的缓存。因为刷新前资源正在使用,还在内存中,刷新后浏览器就直接从内存中取出来了。

当你强制刷新时,浏览器会在请求头中加上 Cache-Control: no-cache 或是 Cache-Control: max-age=0,要求服务端返回最新资源。

Expires

Cache-Control: max-age= ,是缓存的有效时长。

当看到一个叫 max-age(有效时长)的东西时,我们经常会发现它的孪生兄弟:Expires(过期时间点)。如果你熟悉 Cookies,你会发现 Cookies 也有这么一对属性。

Expires: Wed, 21 Oct 2015 07:28:00 GMT

Expires 使用的 GMT 格式的时间戳字符串。

当 max-age 和 Expires 都存在时,使用 max-age。这点和 Cookies 一样。

强缓存,就是让浏览器将资源缓存下来,在缓存过期前,不发送请求获取新资源,而是直接使用本地资源。

协商缓存

协商缓存,是在缓存过期的情况下,客户端和服务端协商,确认客户端缓存是否需要更新。

Last-Modified 和 If-Modified-Since

响应头字段 Last-Modified 表示提供的资源最后被修改的时间。值是 GMT 格式的字符串。

Last-Modified: Sat, 09 Apr 2022 14:47:36 GMT

这个时间会标记在对应缓存上,起到标识的作用。

当浏览器的缓存失效后,会再次请求服务端,并带上 If-Modified-Since 请求头字段,它的值就是之前 Last-Modified 带过来的值。

If-Modified-Since: Sat, 09 Apr 2022 14:47:36 GMT

当服务端发现资源最后修改时间和 If-modified-since 值相等,代表资源从该时间后再未改变过。

服务端于是返回 304(Not Modified)状态码,表示资源没有改变,并且响应体为空。浏览器拿到后,就知道原本可能过期的缓存其实还可以继续使用。

如果资源改变了,就会返回 200,且响应体带上最新资源。

ETag 和 If-None-Match

除了用 Last-Modified 代表的资源最后修改时间作为标识,我们还可以使用 ETag 响应头。

ETag 的值没有规定,你可以是时间戳的哈希值,也可以是版本号。

另外 ETag 分为强 ETag 和弱 ETag,其中弱 ETag 以为 W/ 开头。

ETag: "33a64df551425fcc55e4d42a148795d9f25f89d4"
ETag: W/"0815"

然后和 If-Modified-Since 一样,当缓存过期时,客户端会在请求头带上 If-None-Match 去请求资源。

If-None-Match: "33a64df551425fcc55e4d42a148795d9f25f89d4"

如果资源依旧新鲜,则返回 304,客户端继续复用本地资源。

结尾

强缓存,设置一个过期时间,让客户端在过期前使用本地缓存,直到过期才请求更新鲜的资源。涉及的头字段有 Cache-Control: max-age= 或 Expires 。

协商缓存,在客户端缓存过期的情况下,和服务端协商一下,是否可以继续使用本地缓存。涉及的头字段有 Last-Modified / If-Modified-Since 和 ETag / If-None-Match。

不过需要注意的是,这些都只是规范,我们无法确定客户端或服务端在实现上完全遵循,而且可能在版本更新中会出现一些 bug。

所以对于发生变化的文件,我更倾向于给文件名加上哈希串。毕竟,访问一个从来没访问过的资源,客户端是不会有缓存的。这样就能绕开缓存机制,真正拿到最新资源,而不会掉入缓存陷阱。

参考

  • RFC7234 - Request Cache-Control Directives:https://www.rfc-editor.org/rfc/rfc7234#section-5.2.1。
  • RFC7232 - Weak versus Strong:https://www.rfc-editor.org/rfc/rfc7232#section-2.1。
  • stackoverflow - What takes precedence: the ETag or Last-Modified HTTP header?:https://stackoverflow.com/questions/824152/what-takes-precedence-the-etag-or-last-modified-http-header。
责任编辑:姜华 来源: 今日头条
相关推荐

2021-07-28 13:38:39

HTTP缓存协商

2022-04-27 09:28:11

HTTPExpires

2023-11-16 08:22:14

LruCacheAndroid

2021-03-29 11:51:07

缓存储存数据

2022-03-09 18:54:30

HTTP缓存协议cache

2013-10-16 16:58:17

iOS优化缓存优化

2012-12-17 14:54:55

算法缓存Java

2019-10-12 14:19:05

Redis数据库缓存

2023-03-10 13:33:00

缓存穿透缓存击穿缓存雪崩

2019-03-20 09:11:50

Web缓存策略

2021-05-18 08:31:46

缓存HTTP服务器

2018-07-12 15:30:03

HTTP缓存机制

2019-11-05 14:24:31

缓存雪崩框架

2017-12-27 12:01:39

2017-09-21 10:00:07

缓存web服务器

2017-05-10 11:40:29

缓存Nginx HTTP

2015-10-08 16:40:50

缓存头像策略

2021-06-05 09:01:01

Redis缓存雪崩缓存穿透

2021-11-30 10:58:52

算法缓存技术

2019-08-08 15:47:03

HTTP缓存CDN
点赞
收藏

51CTO技术栈公众号