浅谈本地缓存的几种方案选型-51CTO.COM

一、摘要

说到缓存，面试官基本上会绕不开以下几个话题！

项目中哪些地方用到了缓存？为什么要使用缓存？怎么使用它的？引入缓存后会带来哪些问题？

这些问题，基本上是互联网公司面试时必问的一些问题，如果面试的时候，连缓存都不清楚，那确实多少显的有些尴尬！

项目里面为什么要引入缓存？这个问题还得结合项目中的业务来回答！

引入缓存，其实主要有两个用途：高性能、高并发！

假设某个操作非常频繁，比如网站的商城首页，需要频繁的从数据库里面获取商品数据，可能从数据库一顿各种乱七八糟的操作下来，平均耗时 500 ms，随着请求频次越高，用户等待数据的返回结果时间越来越长，体验越来越差。

如果此时，引入缓存，将数据库里面查询出来的商品数据信息，放入缓存服务里面，当用户再此发起查询操作的时候，直接从缓存服务里面获取，速度从耗时 500 ms，可能直接优化成 5 ms，体验上瞬间会上升好几个层次！

这就是引入缓存带来的高性能体验结果！

当然，除此之外，引入缓存之前，以 mysql 数据库为例，单台机器一秒内的请求次数到达 2000 之后就会开始报警；引入缓存之后，比如以 redis 缓存服务器为例，单台机器一秒内的请求次数支持 110000 次，两者支持的并发量完全不是一个数量级的。

这就是引入缓存带来的高并发体验结果！

尤其是对于流量很大的业务，引入缓存，给系统带来的提升是十分显著的。

可能有的同学又会发出疑问，缓存和数据库为啥差距这么大，有啥区别？

我们都知道在计算机领域，数据的存储主要有两处：一处是内存，另一处是磁盘。

在计算机中，内存的数据读写性能远超磁盘的读写性能，尽管如此，其实两者也有不同，如果数据存储到内存中，虽然读写性能非常高，但是当电脑重启之后，数据会全部清除；而存入磁盘的数据，虽然读写性能很差，但是电脑重启之后数据不会丢失。

因为两者的数据存储方案不同，造就了不同的实践用途！

我们上面讲到的缓存服务，其实本质就是将数据存储到内存中；而数据库服务，是将数据写入到磁盘，从磁盘中读取数据。

无论是哪种方案，没有绝对的好与坏，主要还是取决于实际的业务用途。

在项目中如何引入缓存呢？我们通常的做法如下：

操作步骤：

1.当用户发起访问某数据的操作时，检查缓存服务里面是否存在，如果存在，直接返回；如果不存在，走数据库的查询服务。

2.从数据库里面获取到有效数据之后，存入缓存服务，并返回给用户。

3.当被访问的数据发生更新的时候，需要同时删除缓存服务，以便用户再次查询的时候，能获取到最新的数据。

当然以上的缓存处理办法，对于简单的需要缓存的业务场景，能轻松应对。

但是面对复杂的业务场景和服务架构，尤其是对缓存要求比较高的业务，引入缓存的方式，也会跟着一起变化！

从缓存面向的对象不同，缓存分为：本地缓存、分布式缓存和多级缓存。

所谓本地缓存，相信大家都能理解，在单个计算机服务实例中，直接把数据缓存到内存中进行使用。

但是现在的服务，大多都是以集群的方式来部署，你也可以这样理解，同一个网站服务，同时在两台计算机里面部署，比如你用到的session会话，就无法同时共享，因此需要引入一个独立的缓存服务来连接两台服务器，这个独立部署的缓存服务，我们把这种技术实践方案称为分布式缓存。

在实际的业务中，本地缓存和分布式缓存会同时结合进行使用，当收到访问某个数据的操作时，会优先从本地缓存服务（也叫一级缓存）查询，如果没有，再从分布式缓存服务（也叫二级缓存）里面获取，如果也没有，最后再从数据库里面获取；从数据库查询完成之后，在依次更新分布式缓存服务、本次缓存服务，我们把这个技术实践方案叫多级缓存！

由于篇幅的原因，我们在后期给大家介绍分布式缓存服务、多级缓存服务。

今天主要围绕本地缓存服务的技术实现，给大家进行分享和介绍！

二、方案介绍

如果使用过缓存的同学，可以很容易想到缓存需要哪些东西，通常我们在使用缓存的时候，比较关注两个地方，第一是内存持久化，第二是支持缓存的数据自动过期清楚。

基于以上的要求，我们向介绍以下几种技术实现方案。

2.1、手写一个缓存服务

对于简单的数据缓存，我们完全可以自行编写一套缓存服务，实现过程如下！

首先，创建一个缓存实体类。

public class CacheEntity {

    /**
     * 缓存键
     */
    private String key;

    /**
     * 缓存值
     */
    private Object value;

    /**
     * 过期时间
     */
    private Long expireTime;

    //...set、get
}

接着，编写一个缓存操作工具类CacheUtils。

public class CacheUtils {

    /**
     * 缓存数据
     */
    private final static Map<String, CacheEntity> CACHE_MAP = new ConcurrentHashMap<>();

    /**
     * 定时器线程池，用于清除过期缓存
     */
    private static ScheduledExecutorService executor = Executors.newSingleThreadScheduledExecutor();


    static {
        // 注册一个定时线程任务，服务启动1秒之后，每隔500毫秒执行一次
        executor.scheduleAtFixedRate(new Runnable() {
            @Override
            public void run() {
                // 清理过期缓存
                clearCache();
            }
        },1000,500,TimeUnit.MILLISECONDS);
    }

    /**
     * 添加缓存
     * @param key    缓存键
     * @param value  缓存值
     */
    public static void put(String key, Object value){
        put(key, value, 0);
    }


    /**
     * 添加缓存
     * @param key    缓存键
     * @param value  缓存值
     * @param expire 缓存时间，单位秒
     */
    public static void put(String key, Object value, long expire){
        CacheEntity cacheEntity = new CacheEntity()
                .setKey(key)
                .setValue(value);
        if(expire > 0){
            Long expireTime = System.currentTimeMillis() + Duration.ofSeconds(expire).toMillis();
            cacheEntity.setExpireTime(expireTime);
        }
        CACHE_MAP.put(key, cacheEntity);
    }


    /**
     * 获取缓存
     * @param key
     * @return
     */
    public static Object get(String key){
        if(CACHE_MAP.containsKey(key)){
            return CACHE_MAP.get(key).getValue();
        }
        return null;
    }

    /**
     * 移除缓存
     * @param key
     */
    public static void remove(String key){
        if(CACHE_MAP.containsKey(key)){
            CACHE_MAP.remove(key);
        }
    }

    /**
     * 清理过期的缓存数据
     */
    private static void clearCache(){
        if(CACHE_MAP.size() > 0){
            return;
        }
        Iterator<Map.Entry<String, CacheEntity>> iterator = CACHE_MAP.entrySet().iterator();
        while (iterator.hasNext()){
            Map.Entry<String, CacheEntity> entry = iterator.next();
            if(entry.getValue().getExpireTime() != null && entry.getValue().getExpireTime().longValue() > System.currentTimeMillis()){
                iterator.remove();
            }
        }
    }

}

最后，我们来测试一下缓存服务。

// 写入缓存数据
CacheUtils.put("userName", "张三", 3);

// 读取缓存数据
Object value1 = CacheUtils.get("userName");
System.out.println("第一次查询结果：" + value1);

// 停顿4秒
Thread.sleep(4000);

// 读取缓存数据
Object value2 = CacheUtils.get("userName");
System.out.println("第二次查询结果：" + value2);

输出结果，与预期一致！

第一次查询结果：张三
第二次查询结果：null

实现思路其实很简单，采用ConcurrentHashMap作为缓存数据存储服务，然后开启一个定时调度，每隔500毫秒检查一下过期的缓存数据，然后清除掉！

2.2、基于 Guava Cache 实现本地缓存

Guava 是 Google 团队开源的一款 Java 核心增强库，包含集合、并发原语、缓存、IO、反射等工具箱，性能和稳定性上都有保障，应用十分广泛。

相比自己编写的缓存服务，Guava Cache 要强大的多，支持很多特性如下：

支持最大容量限制
支持两种过期删除策略（插入时间和读取时间）
支持简单的统计功能
基于 LRU 算法实现

使用方面也很简单，首先引入guava库包。

<!--guava-->
<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>31.1-jre</version>
</dependency>

案例代码如下：

// 创建一个缓存实例
Cache<String, String> cache = CacheBuilder.newBuilder()
        // 初始容量
        .initialCapacity(5)
        // 最大缓存数，超出淘汰
        .maximumSize(10)
        // 过期时间
        .expireAfterWrite(3, TimeUnit.SECONDS)
        .build();

// 写入缓存数据
cache.put("userName", "张三");

// 读取缓存数据
String value1 = cache.get("userName", () -> {
    // 如果key不存在，会执行回调方法
    return "key已过期";
});
System.out.println("第一次查询结果：" + value1);

// 停顿4秒
Thread.sleep(4000);

// 读取缓存数据
String value2 = cache.get("userName", () -> {
    // 如果key不存在，会执行回调方法
    return "key已过期";
});
System.out.println("第二次查询结果：" + value2);

输出结果：

第一次查询结果：张三
第二次查询结果：key已过期

2.3、基于 Caffeine 实现本地缓存

Caffeine 是基于 java8 实现的新一代缓存工具，缓存性能接近理论最优，可以看作是 Guava Cache 的增强版，功能上两者类似，不同的是 Caffeine 采用了一种结合 LRU、LFU 优点的算法：W-TinyLFU，在性能上有明显的优越性。

使用方面也很简单，首先引入caffeine库包。

<!--caffeine-->
<dependency>
    <groupId>com.github.ben-manes.caffeine</groupId>
    <artifactId>caffeine</artifactId>
    <version>2.9.3</version>
</dependency>

案例代码如下：

// 创建一个缓存实例
Cache<String, String> cache = Caffeine.newBuilder()
        // 初始容量
        .initialCapacity(5)
        // 最大缓存数，超出淘汰
        .maximumSize(10)
        // 设置缓存写入间隔多久过期
        .expireAfterWrite(3, TimeUnit.SECONDS)
        // 设置缓存最后访问后间隔多久淘汰，实际很少用到
        //.expireAfterAccess(3, TimeUnit.SECONDS)
        .build();

// 写入缓存数据
cache.put("userName", "张三");

// 读取缓存数据
String value1 = cache.get("userName", (key) -> {
    // 如果key不存在，会执行回调方法
    return "key已过期";
});
System.out.println("第一次查询结果：" + value1);

// 停顿4秒
Thread.sleep(4000);

// 读取缓存数据
String value2 = cache.get("userName", (key) -> {
    // 如果key不存在，会执行回调方法
    return "key已过期";
});
System.out.println("第二次查询结果：" + value2);

输出结果：

第一次查询结果：张三
第二次查询结果：key已过期

2.4、基于 Encache 实现本地缓存

Encache 是一个纯 Java 的进程内缓存框架，具有快速、精干等特点，是 Hibernate 中默认的 CacheProvider。

同 Caffeine 和 Guava Cache 相比，Encache 的功能更加丰富，扩展性更强，特性如下：

支持多种缓存淘汰算法，包括 LRU、LFU 和 FIFO
缓存支持堆内存储、堆外存储、磁盘存储（支持持久化）三种
支持多种集群方案，解决数据共享问题

使用方面也很简单，首先引入ehcache库包。

<!--ehcache-->
<dependency>
    <groupId>org.ehcache</groupId>
    <artifactId>ehcache</artifactId>
    <version>3.9.7</version>
</dependency>

案例代码如下：

/**
 * 自定义过期策略实现
 */
public  class CustomExpiryPolicy<K, V> implements ExpiryPolicy<K, V> {

    private final Map<K, Duration> keyExpireMap = new ConcurrentHashMap();


    public Duration setExpire(K key, Duration duration) {
        return keyExpireMap.put(key, duration);
    }

    public Duration getExpireByKey(K key) {
        return Optional.ofNullable(keyExpireMap.get(key))
                .orElse(null);
    }

    public Duration removeExpire(K key) {
        return keyExpireMap.remove(key);
    }

    @Override
    public Duration getExpiryForCreation(K key, V value) {
        return Optional.ofNullable(getExpireByKey(key))
                .orElse(Duration.ofNanos(Long.MAX_VALUE));
    }

    @Override
    public Duration getExpiryForAccess(K key, Supplier<? extends V> value) {
        return getExpireByKey(key);
    }

    @Override
    public Duration getExpiryForUpdate(K key, Supplier<? extends V> oldValue, V newValue) {
        return getExpireByKey(key);
    }
}

public static void main(String[] args) throws InterruptedException {
    String userCache = "userCache";

    // 自定义过期策略
    CustomExpiryPolicy<Object, Object> customExpiryPolicy = new CustomExpiryPolicy<>();

    // 声明一个容量为20的堆内缓存配置
    CacheConfigurationBuilder configurationBuilder = CacheConfigurationBuilder
            .newCacheConfigurationBuilder(String.class, String.class, ResourcePoolsBuilder.heap(20))
            .withExpiry(customExpiryPolicy);

    // 初始化一个缓存管理器
    CacheManager cacheManager = CacheManagerBuilder.newCacheManagerBuilder()
            // 创建cache实例
            .withCache(userCache, configurationBuilder)
            .build(true);

    // 获取cache实例
    Cache<String, String> cache = cacheManager.getCache(userCache, String.class, String.class);
    // 获取过期策略
    CustomExpiryPolicy expiryPolicy = (CustomExpiryPolicy)cache.getRuntimeConfiguration().getExpiryPolicy();

    // 写入缓存数据
    cache.put("userName", "张三");
    // 设置3秒过期
    expiryPolicy.setExpire("userName", Duration.ofSeconds(3));

    // 读取缓存数据
    String value1 = cache.get("userName");
    System.out.println("第一次查询结果：" + value1);

    // 停顿4秒
    Thread.sleep(4000);

    // 读取缓存数据
    String value2 = cache.get("userName");
    System.out.println("第二次查询结果：" + value2);
}

输出结果：

第一次查询结果：张三
第二次查询结果：null

三、小结

从易用性角度看：Guava Cache、Caffeine 和 Encache 都有十分成熟的接入方案，使用简单。

从功能性角度看：Guava Cache 和 Caffeine 功能类似，都是只支持堆内缓存，Encache 相比功能更为丰富，不仅支持堆内缓存，还支持磁盘写入、集群实现。

从性能角度看：Caffeine 最优、GuavaCache 次之，Encache 最差。

以下是网络上三者性能对比的结果。

对于本地缓存的技术选型，推荐采用 Caffeine，性能上毫无疑问，遥遥领先。

虽然 Encache 功能非常的丰富，甚至提供了持久化和集群的功能，但是相比更成熟的分布式缓存中间件 redis 来说，还是稍逊一些！

关于 redis 的使用，有兴趣的同学可以查看历史文章，之前有写过 redis 系列相关的技术实践介绍。

本文参考了很多其他博主的文章，内容难免有描述不对的地方，欢迎网友留言指出！