Guava Cache 异步刷新技巧,你值得拥有!

开发 前端
Guava Cache 的数据结构跟 JDK1.7 的 ConcurrentHashMap 类似,提供了基于时间、容量、引用三种回收策略,以及自动加载、访问统计等功能。 图片

Guava Cache是一款非常优秀的本地缓存框架。

这篇文章,我们聊聊如何使用 Guava Cache 异步刷新技巧带飞系统性能 。

图片图片

1 经典配置

Guava Cache 的数据结构跟 JDK1.7 的 ConcurrentHashMap 类似,提供了基于时间、容量、引用三种回收策略,以及自动加载、访问统计等功能。

图片图片

首先,我们温习下 Gauva Cache 的经典配置 。

图片图片

例子中,缓存最大容量设置为 100 (基于容量进行回收),配置了失效策略和刷新策略。

  • 失效策略

配置 expireAfterWrite 后,缓存项在被创建或最后一次更新后的指定时间内会过期。

  • 刷新策略

配置 refreshAfterWrite 设置刷新时间,当缓存项过期的同时可以重新加载新值 。

这个例子里,有的同学可能会有疑问:为什么需要配置刷新策略,只配置失效策略不就可以吗?

当然是可以的,但在高并发场景下,配置刷新策略会有奇效,接下来,我们会写一个测试用例,方便大家理解 Gauva Cache 的线程模型。

2  理解线程模型

我们模拟在多线程场景下,「缓存过期执行 load 方法」和「刷新执行 reload 方法」两者的运行情况。

图片图片

执行结果见下图:

图片图片

执行结果表明:Guava Cache 并没有后台任务线程异步的执行 load 或者 reload 方法。

失效策略:expireAfterWrite 允许一个线程执行 load 方法,其他线程阻塞等待 。当大量线程用相同的 key 获取缓存值时,只会有一个线程进入 load 方法,而其他线程则等待,直到缓存值被生成。这样也就避免了缓存击穿的危险。高并发场景下 ,这样还是会阻塞大量线程。

刷新策略:refreshAfterWrite 允许一个线程执行 load 方法,其他线程返回旧的值。单个 key 并发下,使用 refreshAfterWrite ,虽然不会阻塞了,但是如果恰巧同时多个 key 同时过期,还是会给数据库造成压力。

为了提升系统性能,我们可以从如下两个方面来优化 :

  1. 配置  refresh < expire ,减少大量线程阻塞的概率;
  2. 采用异步刷新的策略,也就是线程异步加载数据,期间所有请求返回旧的缓存值,防止缓存雪崩。

下图展示优化方案的时间轴 :

图片图片

3 两种方式实现异步刷新

3.1 重写 reload 方法

图片图片

3.2 实现 asyncReloading 方法

图片图片

不管使用哪种方案, 都需要定义单独的线程池来执行刷新任务 。

4 异步刷新 + 多级缓存

2018 年,笔者服务的一家电商公司需要进行 app 首页接口的性能优化。笔者花了大概两天的时间完成了整个方案,采取的是两级缓存模式,同时采用了 Guava 的异步刷新机制。

整体架构如下图所示:

图片图片

缓存读取流程如下 :

  • 业务网关刚启动时,本地缓存没有数据,读取 Redis 缓存,如果 Redis 缓存也没数据,则通过 RPC 调用导购服务读取数据,然后再将数据写入本地缓存和 Redis 中;若 Redis 缓存不为空,则将缓存数据写入本地缓存中。
  • 由于步骤1已经对本地缓存预热,后续请求直接读取本地缓存,返回给用户端。
  • Guava 配置了 refresh 机制,每隔一段时间会调用自定义 LoadingCache 线程池(5个最大线程,5个核心线程)去导购服务同步数据到本地缓存和 Redis 中。

优化后,性能表现很好,平均耗时在 5ms 左右,同时大幅度的减少应用 GC 的频率。

该方案依然有瑕疵,一天晚上我们发现 app 端首页显示的数据时而相同,时而不同。

也就是说:虽然 LoadingCache 线程一直在调用接口更新缓存信息,但是各个服务器本地缓存中的数据并非完成一致。

这说明了两个很重要的点:

  • 惰性加载仍然可能造成多台机器的数据不一致;
  • LoadingCache 线程池数量配置的不太合理,  导致了任务堆积。

最终,我们的解决方案是:

  • 异步刷新结合消息机制来更新缓存数据,也就是:当导购服务的配置发生变化时,通知业务网关重新拉取数据,更新缓存。
  • 适当调大 LoadingCache 的线程池参数,并在线程池埋点,监控线程池的使用情况,当线程繁忙时能发出告警,然后动态修改线程池参数。

5 总结

Guava Cache 非常强大,它并没有后台任务线程异步的执行 load 或者 reload 方法,而是通过请求线程来执行相关操作。

为了提升系统性能,我们可以从如下两个方面来处理 :

  • 配置 refresh < expire,减少大量线程阻塞的概率。
  • 采用异步刷新的策略,也就是线程异步加载数据,期间所有请求返回旧的缓存值。

笔者曾经优化过某电商网站的首页接口,使用的方案是:Guava 的异步刷新机制 + 多级缓存 ,取得了非常好的优化效果。

尽管如此,我们在使用这种方式时,依然需要考虑的缓存和数据库一致性问题。

参考资料:

https://albenw.github.io/posts/df42dc84/


责任编辑:武晓燕 来源: 勇哥Java实战
相关推荐

2021-01-21 09:45:16

Python字符串代码

2021-03-18 07:52:42

代码性能技巧开发

2020-02-03 12:25:35

Python工具服务器

2021-09-06 10:22:47

匿名对象编程

2023-12-29 08:17:26

Python代码分析Profile

2024-08-29 08:28:17

2020-12-14 13:32:40

Python进度条参数

2021-07-05 09:40:57

工具Node开源

2014-12-19 10:55:17

Linux性能监控

2020-09-01 07:41:56

macOS工具

2024-12-18 16:53:13

ncduLinux磁盘分析

2022-09-21 08:16:18

缓存框架

2020-10-09 11:54:33

Vue用户的React

2020-03-08 13:24:47

JavaScript开发

2022-01-18 16:42:03

区块链加密信息资源

2020-06-15 14:43:16

Python开发工具

2011-10-08 10:15:29

Web

2013-07-05 16:08:40

开发效率

2016-07-28 09:37:30

开源协作软件Collabtive

2023-09-11 07:46:03

Cache2k缓存
点赞
收藏

51CTO技术栈公众号