你知道缓存的这个问题到底把多少程序员坑惨了吗?

开发 前端
如果是比较复杂的项目,甚至能再进一步的优化,也就是借用定时任务和MQ来替代休眠线程,实现异步删除缓存,达到弱一致性的结果。

引言

你是不是也经历过这种情况?某个阳光明媚的上午,你正享受着枸杞泡水和敲代码的美妙时刻,突然接到客服部门的电话。

电话那头的声音急切又焦虑:“客户抱怨说,怎么点击购买总是失败?”

作为技术人员,你瞬间脑袋里浮现出无数可能的原因,其中最让人头疼的,莫过于缓存与数据库的不一致问题。

这个问题不仅影响用户体验,还可能导致业务数据的混乱。

今儿就来聊聊缓存与数据库不一致的问题,帮大家理清楚问题所在,并给出推荐方案。

问题剖析

在现代系统中,缓存可以极大地提升性能,减少数据库的压力。

然而,一旦缓存和数据库的数据不一致,就会引发各种诡异的问题。

系统维护的重要性在此凸显,极端手段比如清空缓存,可能会在短时间内解决问题,但从长远来看,这些操作往往带来更大的隐患。

解决方案概览

我们来看看几种常见的解决缓存与数据库不一致的方案,每种方案都有各自的优缺点:

  1. 先更新缓存,再更新数据库
  2. 先更新数据库,再更新缓存
  3. 先删除缓存,后更新数据库
  4. 先更新数据库,后删除缓存

深入探讨

先更新缓存,再更新数据库

这种方案看似简单,实际上很少被推荐。

原因在于如果在更新数据库之前发生了错误,缓存中的数据将和数据库中的数据不一致,最终导致更大的问题。

public void updateCacheThenDatabase(String key, String value) {
    cache.put(key, value);
    try {
        database.update(key, value);
    } catch (Exception e) {
        // 数据库更新失败,缓存数据可能错误
        System.err.println("数据库更新失败: " + e.getMessage());
    }
}

先更新数据库,再更新缓存

这种方法解决了更新缓存失败的问题,但可能引发另外一个问题:

在高并发场景下,数据库已经更新,但缓存还没有更新时,其他请求可能会读到旧的缓存数据。

public void updateDatabaseThenCache(String key, String value) {
    database.update(key, value);
    cache.put(key, value);
}

先删除缓存,后更新数据库

这种方案在高并发下容易产生问题:

在缓存删除和数据库更新之间的时间窗口内,其他请求可能会读取到旧的数据,导致短时间内的数据不一致。

public void deleteCacheThenUpdateDatabase(String key, String value) {
    cache.remove(key);
    try {
        database.update(key, value);
    } catch (Exception e) {
        // 数据库更新失败,需要重新设置缓存
        cache.put(key, getOldValueFromDatabase(key));
        System.err.println("数据库更新失败: " + e.getMessage());
    }
}

先更新数据库,后删除缓存

这是较为推荐的一种方法,但在高并发场景下也有一定的局限性:

如果数据库更新成功但缓存删除失败,可能导致短时间内的数据不一致。

public void updateDatabaseThenDeleteCache(String key, String value) {
    database.update(key, value);
    cache.remove(key);
}

强一致性与最终一致性

在讨论一致性的时候,我们常常会提到强一致性和最终一致性。

强一致性保证每次读取的数据都是最新的,但在分布式系统中实现成本较高。

最终一致性则允许数据在一定时间内不一致,适用于大多数实际业务场景。

根据业务需求权衡这两者,是缓存策略设计中的重要一步。

后面我会给出一个弱一致性的推荐方案,供大家参考。

SpringCache

SpringCache是一个非常实用的缓存管理框架,能帮助我们简化缓存操作。

以下是一个简单的SpringCache配置示例:

@Configuration
@EnableCaching
public class CacheConfig {
    @Bean
    public CacheManager cacheManager() {
        return new ConcurrentMapCacheManager("entities");
    }
}

SpringCache 的优点:

  • 简化缓存管理:SpringCache 提供了简洁的 API,能够轻松集成到现有项目中。
  • 注解驱动:使用注解如 @Cacheable、@CachePut 和 @CacheEvict,使得缓存操作更直观。
  • 灵活配置:支持多种缓存实现,能够根据需求选择合适的缓存方案。

SpringCache 的缺点:

  • 限制性:默认的缓存管理器在一些复杂场景下可能不够灵活。
  • 性能瓶颈:在高并发场景下,内存缓存可能会成为性能瓶颈,需要合理设计和优化。

常用的注解包括@Cacheable、@CachePut和@CacheEvict:

@Cacheable("entities")
public Entity findById(Long id) {
    // 如果缓存中存在,则直接返回缓存中的数据
    // 否则调用方法查询数据库,并将结果存入缓存
    return repository.findById(id).orElse(null);
}

@CachePut(value = "entities", key = "#entity.id")
public Entity updateEntity(Entity entity) {
    // 更新数据库,同时更新缓存中的数据
    return repository.save(entity);
}

@CacheEvict(value = "entities", allEntries = true)
public void clearCache() {
    // 清空缓存
}

缓存预热策略

缓存预热的重要性不言而喻,上线后瞬时大流量可能导致缓存击穿。

以下是几种常见的缓存预热方案:

  1. 启动时加载:系统启动时加载常用数据到缓存。
@Component
public class CachePreloader {
    @Autowired
    private CacheManager cacheManager;

    @PostConstruct
    public void preload() {
        Cache cache = cacheManager.getCache("entities");
        if (cache != null) {
            // 假设我们有一个服务可以获取需要预热的数据
            List<Entity> entities = fetchEntitiesForPreloading();
            for (Entity entity : entities) {
                cache.put(entity.getId(), entity);
            }
        }
    }

    private List<Entity> fetchEntitiesForPreloading() {
        // 获取需要预热的数据
        return repository.findAll();
    }
}
  1. 定时加载:定时任务定期加载数据。
@Component
public class ScheduledCachePreloader {
    @Autowired
    private CacheManager cacheManager;

    @Scheduled(fixedRate = 60000) // 每分钟执行一次
    public void preload() {
        Cache cache = cacheManager.getCache("entities");
        if (cache != null) {
            // 获取需要预热的数据并加载到缓存
            List<Entity> entities = fetchEntitiesForPreloading();
            for (Entity entity : entities) {
                cache.put(entity.getId(), entity);
            }
        }
    }

    private List<Entity> fetchEntitiesForPreloading() {
        // 获取需要预热的数据
        return repository.findAll();
    }
}
  1. 手动加载:手动执行预热脚本。
@Component
public class ManualCachePreloader {
    @Autowired
    private CacheManager cacheManager;

    public void preload() {
        Cache cache = cacheManager.getCache("entities");
        if (cache != null) {
            // 获取需要预热的数据并加载到缓存
            List<Entity> entities = fetchEntitiesForPreloading();
            for (Entity entity : entities) {
                cache.put(entity.getId(), entity);
            }
        }
    }

    private List<Entity> fetchEntitiesForPreloading() {
        // 获取需要预热的数据
        return repository.findAll();
    }
}

推荐方案

综合考虑各种方案的优缺点,我给大家一种工作中真正常用的方案,也是我待过的互联网公司中实践过的方案。

基本策略:删除Redis中缓存 -> 更新数据库 -> 最新数据set到Redis

延迟双删:删除Redis中缓存 -> 更新数据库 -> 休眠500ms -> 再次删除Redis中缓存 -> 最新数据set到Redis

延迟三删:删除Redis中缓存 -> 更新数据库 -> 休眠500ms -> 再次删除Redis中缓存 -> 休眠500ms -> 再次删除Redis中缓存 -> 最新数据set到Redis

这是一种非常简单且成本很低的操作,但能解决绝大多数的缓存与数据库不一致问题。

原理很好理解,就是更新数据库之后设置合理的休眠时间,然后再次删除掉其他线程请求进来导致的旧缓存,最终达到缓存和数据库都是最新数据的目的。

其中休眠时间要根据自身业务的平均耗时来决定,而延迟双删其实就够了,延迟三删只是为了开阔大家的思路,因为真有些公司删除三次来保证一些极端情况的不一致,但我觉得没必要,太极端就不是弱一致性了。

如果是比较复杂的项目,甚至能再进一步的优化,也就是借用定时任务和MQ来替代休眠线程,实现异步删除缓存,达到弱一致性的结果。

总结与思考

缓存与数据库一致性是一个复杂的问题,需要根据具体业务场景选择合适的策略。

大家需要记住一点,高可用性是系统的最优先选择,所以弱一致性就必然成为数据不一致性的最优解,这是一种良性闭环。

因为系统不能用,那是直接亏损,但数据出现低量的不一致,完全可以接受。

责任编辑:武晓燕 来源: Java分享客栈
相关推荐

2024-03-14 10:30:05

缓存场景DEMO

2021-09-29 09:07:22

Docker 日志容器

2020-12-08 10:35:29

程序员IT数据分析

2021-12-27 07:25:13

项目软件开发

2021-05-12 14:10:17

程序员IT互联网

2017-12-12 17:00:20

程序员面试失败原因

2019-07-12 15:28:41

缓存数据库浏览器

2023-11-08 08:58:58

GPT-4神经网络智能

2019-07-15 12:40:02

Linux基础知识程序员

2012-08-12 23:34:47

回顾

2020-09-14 08:47:46

缓存程序员存储

2018-02-06 08:36:02

简历程序员面试

2018-11-22 10:53:30

程序员技能开发者

2018-01-31 22:31:49

大数据程序员编程

2009-05-21 15:58:12

程序员工作经验职场

2024-01-09 07:39:20

maven特性版本

2013-04-22 09:15:20

2019-08-21 13:40:50

2021-09-23 14:44:24

程序员计算机开发

2011-07-15 16:06:16

程序员
点赞
收藏

51CTO技术栈公众号