Resilience4j 深度揭秘:如何在 Spring Boot 中实现容错机制

开发 架构
本文将详细介绍如何在 Spring Boot 项目中整合 Resilience4j,使你的应用更具弹性和可靠性。

在现代微服务架构中,服务之间的调用可能会因网络延迟、服务故障等原因导致失败。为了解决这些问题,Resilience4j 提供了一套可靠的容错机制。本文将详细介绍如何在 Spring Boot 项目中整合 Resilience4j,使你的应用更具弹性和可靠性。

一、Resilience4j 简介

什么是 Resilience4j

Resilience4j 是一个轻量级的容错库,专为 Java 8 及以上版本设计。它提供了一组强大的容错机制,包括断路器(Circuit Breaker)、限流器(Rate Limiter)、舱壁隔离(Bulkhead)、重试(Retry)和时间限制器(Time Limiter)。

主要特性

  • 断路器(Circuit Breaker):防止一个服务的故障蔓延到整个系统。
  • 限流器(Rate Limiter):限制特定时间内的请求数量,防止过载。
  • 舱壁隔离(Bulkhead):隔离系统的不同部分,防止故障蔓延。
  • 重试(Retry):在请求失败时自动重试。
  • 时间限制器(Time Limiter):为请求设置时间限制,防止长时间等待。

与 Hystrix 的对比

Resilience4j 旨在取代 Netflix Hystrix,提供更轻量和现代的解决方案。与 Hystrix 相比,Resilience4j 的主要优势在于它的依赖更少、性能更好,并且完全支持 Java 8 以上的函数式编程特性。

二、环境准备

项目初始化

使用 Spring Initializr 创建一个新的 Spring Boot 项目,并添加以下依赖:

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-web</artifactId>
</dependency>

<dependency>
    <groupId>io.github.resilience4j</groupId>
    <artifactId>resilience4j-spring-boot2</artifactId>
    <version>2.1.0</version>
</dependency>

三、配置 Resilience4j

基本配置

在 application.yml 文件中添加基本配置:

resilience4j:
  circuitbreaker:
    configs:
      default:
        registerHealthIndicator: true
        slidingWindowSize: 100
        minimumNumberOfCalls: 10
        failureRateThreshold: 50
        waitDurationInOpenState: 10000
        permittedNumberOfCallsInHalfOpenState: 3

配置项解释:

  • registerHealthIndicator: 是否注册 Circuit Breaker 的健康指标,默认为 false。设置为 true 可以通过 Actuator 端点监控 Circuit Breaker 的状态。
  • slidingWindowSize: 滑动窗口的大小,用于计算失败率。这里设置为 100,表示最近 100 个请求会被用来计算失败率。
  • minimumNumberOfCalls: 在滑动窗口内,至少需要有这么多请求才能开始计算失败率。这里设置为 10,表示至少需要 10 个请求后才会开始计算失败率。
  • failureRateThreshold: 失败率阈值,当失败率超过这个值时,Circuit Breaker 会进入 OPEN 状态。这里设置为 50,表示当失败率超过 50% 时,Circuit Breaker 会打开。
  • waitDurationInOpenState: Circuit Breaker 处于 OPEN 状态时的等待时间,单位毫秒。这里设置为 10000,表示 Circuit Breaker 打开后会等待 10 秒钟。
  • permittedNumberOfCallsInHalfOpenState: Circuit Breaker 处于 HALF_OPEN 状态时允许的请求数。这里设置为 3,表示 Circuit Breaker 半开状态时允许 3 个请求通过。

这段配置定义了一个基本的 Circuit Breaker 行为,可以保护系统免受频繁失败的服务的影响。通过调整这些参数,可以根据具体应用场景来优化 Circuit Breaker 的行为。

注意: 这只是默认配置,可以在创建 Circuit Breaker 实例时覆盖这些配置。

配置 Circuit Breaker

配置断路器:

resilience4j:
  circuitbreaker:
    instances:
      backendA:
        registerHealthIndicator: true
        slidingWindowSize: 100
        minimumNumberOfCalls: 10
        failureRateThreshold: 50
        waitDurationInOpenState: 10000
        permittedNumberOfCallsInHalfOpenState: 3

不同于之前的默认配置,这里明确定义了一个名为 backendA 的 Circuit Breaker 实例,并为其指定了具体的配置参数。这意味着,这个配置只适用于名为 backendA 的 Circuit Breaker 实例,而其他 Circuit Breaker 实例将使用默认配置(如果存在)。

配置 Rate Limiter

配置限流器:

resilience4j:
  ratelimiter:
    instances:
      backendA:
        limitForPeriod: 10
        limitRefreshPeriod: 5000

配置项解释:

  • limitForPeriod: 在限流周期内允许的最大请求数。这里设置为 10,表示在 5 秒内最多允许 10 个请求。
  • limitRefreshPeriod: 限流周期的持续时间,单位毫秒。这里设置为 5000,表示限流周期为 5 秒。

配置含义:

这段配置定义了一个名为 backendA 的 RateLimiter 实例,用于控制对 backendA 服务或资源的访问速率。

(1)限流策略: Resilience4j 使用令牌桶算法实现限流。RateLimiter 会维护一个固定数量的令牌,每个令牌代表一个请求的许可。当请求到达时,RateLimiter 会尝试获取令牌。如果获取成功,则允许请求继续执行;如果获取失败,则请求会被拒绝或延迟处理。

(2) 限流配置: 本段配置中的 limitForPeriod 和 limitRefreshPeriod 参数定义了 RateLimiter 的限流策略。

  • limitForPeriod 规定了限流周期内允许的最大请求数。例如,本例中设置为 10,表示在 5 秒内最多允许 10 个请求。
  • limitRefreshPeriod 规定了限流周期的持续时间。例如,本例中设置为 5000,表示限流周期为 5 秒。这意味着,RateLimiter 会每隔 5 秒重新计算可用的令牌数。

限流效果:

假设 limitForPeriod 为 10,limitRefreshPeriod 为 5000。那么,在任意的 5 秒内,系统最多只会处理 10 个请求。如果在 5 秒内收到超过 10 个请求,则后面的请求会被拒绝或延迟处理。

配置 Bulkhead

配置舱壁隔离:

resilience4j:
  bulkhead:
    instances:
      backendA:
        maxConcurrentCalls: 25
        maxWaitDuration: 100

配置项解释:

  • maxConcurrentCalls: 同时允许的最大并发调用数。这里设置为 25,表示 backendA 服务最多可以同时处理 25 个并发请求。
  • maxWaitDuration: 当并发请求超过 maxConcurrentCalls 限制时,新请求最长等待时间,单位毫秒。这里设置为 100,表示新请求最多等待 100 毫秒,如果仍然无法获得处理资源,则会被拒绝或抛出异常。

配置含义:

这段配置定义了一个名为 backendA 的 Bulkhead 实例,用于控制对 backendA 服务或资源的并发访问。

(1)隔离策略: Resilience4j 使用令牌桶算法实现对并发请求的隔离。Bulkhead 会维护一个固定数量的令牌,每个令牌代表一个处理资源的许可。当请求到达时,Bulkhead 会尝试获取令牌。如果获取成功,则允许请求继续执行;如果获取失败,则请求会被拒绝或延迟处理。

(2)并发控制: 本段配置中的 maxConcurrentCalls 和 maxWaitDuration 参数定义了 Bulkhead 的并发控制策略。

  • maxConcurrentCalls 规定了同时允许的最大并发调用数。例如,本例中设置为 25,表示 backendA 服务最多可以同时处理 25 个并发请求。
  • maxWaitDuration 规定了当并发请求超过 maxConcurrentCalls 限制时,新请求最长等待时间。例如,本例中设置为 100,表示新请求最多等待 100 毫秒,如果仍然无法获得处理资源,则会被拒绝或抛出异常。

限流效果:

假设 maxConcurrentCalls 为 25,maxWaitDuration 为 100。那么,backendA 服务最多可以同时处理 25 个并发请求。如果在同一时刻收到超过 25 个请求,则后面的请求会尝试等待 100 毫秒。如果在 100 毫秒内仍然无法获得处理资源,则会被拒绝或抛出异常。

配置 Retry

配置重试:

resilience4j:
  retry:
    instances:
      backendA:
        maxAttempts: 3
        waitDuration: 500

配置项解释:

  • maxAttempts: 最大重试次数,包括第一次调用在内。这里设置为 3,表示当 backendA 服务调用失败时,最多会重试 2 次。
  • waitDuration: 重试间隔时间,单位毫秒。这里设置为 500,表示每次重试之前会等待 500 毫秒。

配置含义:

这段配置定义了一个名为 backendA 的 Retry 实例,用于对 backendA 服务或资源的调用进行重试操作。

重试策略: 当 backendA 服务调用失败时,Retry 实例会根据配置的重试策略进行重试。

  • maxAttempts 规定了最大重试次数。例如,本例中设置为 3,表示当 backendA 服务调用失败时,最多会重试 2 次。
  • waitDuration 规定了重试间隔时间。例如,本例中设置为 500,表示每次重试之前会等待 500 毫秒。

重试流程:

  • 当调用 backendA 服务发生异常时,Retry 实例会进行重试。
  • 重试之前,会等待 waitDuration 指定的时间。
  • 重试时,会再次调用 backendA 服务。
  • 如果重试成功,则返回结果并结束。
  • 如果重试 maxAttempts 次后仍然失败,则抛出异常。

通过这种方式,你可以为不同的服务或资源创建 Retry 实例,并根据它们的具体需求进行配置,以提高服务的容错性和可用性。

配置 Time Limiter

配置时间限制器:

resilience4j:
  timelimiter:
    instances:
      backendA:
        timeoutDuration: 1000

配置项解释:

timeoutDuration: 操作的超时时间,单位毫秒。这里设置为 1000,表示 backendA 服务的调用必须在 1 秒内完成,否则会被视为超时。

配置含义:

这段配置定义了一个名为 backendA 的 TimeLimiter 实例,用于对 backendA 服务或资源的调用进行超时控制。

超时策略: 当 backendA 服务调用超过 timeoutDuration 指定的时间时,TimeLimiter 实例会认为其超时,并抛出 TimeoutException 异常。

超时效果:

假设 timeoutDuration 为 1000。那么,当调用 backendA 服务时,如果超过 1 秒仍然没有完成,则会被 TimeLimiter 实例视为超时,并抛出 TimeoutException 异常。

四、、实现功能

实现 Circuit Breaker

在 backendA 服务中使用断路器:

import io.github.resilience4j.circuitbreaker.annotation.CircuitBreaker;
import org.springframework.stereotype.Service;
import org.springframework.web.client.RestTemplate;

@Service
public class BackendAService {

    private final RestTemplate restTemplate;

    public BackendAService(RestTemplate restTemplate) {
        this.restTemplate = restTemplate;
    }

    @CircuitBreaker(name = "backendA", fallbackMethod = "fallback")
    public String callExternalService() {
        return restTemplate.getForObject("http://external-service/api", String.class);
    }

    public String fallback(Exception e) {
        return "外部服务不可用";
    }
}

实现 Rate Limiter

在 backendA 服务中使用限流器:

import io.github.resilience4j.ratelimiter.annotation.RateLimiter;
import org.springframework.stereotype.Service;

@Service
public class BackendAService {

    @RateLimiter(name = "backendA")
    public String callExternalService() {
        // 外部服务调用逻辑
        return "外部服务的响应";
    }
}

实现 Bulkhead

在 backendA 服务中使用舱壁隔离:

import io.github.resilience4j.bulkhead.annotation.Bulkhead;
import org.springframework.stereotype.Service;

@Service
public class BackendAService {

    @Bulkhead(name = "backendA")
    public String callExternalService() {
        // 外部服务调用逻辑
        return "外部服务的响应";
    }
}

实现 Retry

在 backendA 服务中使用重试:

import io.github.resilience4j.retry.annotation.Retry;
import org.springframework.stereotype.Service;

@Service
public class BackendAService {

    @Retry(name = "backendA")
    public String callExternalService() {
        // 外部服务调用逻辑
        return "外部服务的响应";
    }

实现 Time Limiter

在 backendA 服务中使用时间限制器:

import io.github.resilience4j.timelimiter.annotation.TimeLimiter;
import org.springframework.stereotype.Service;

import java.util.concurrent.CompletableFuture;

@Service
public class BackendAService {

    @TimeLimiter(name = "backendA")
    public CompletableFuture<String> callExternalService() {
        return CompletableFuture.supplyAsync(() -> {
            // 外部服务调用逻辑
            return "外部服务的响应";
        });
    }
}

五、高级主题

自定义配置

如何进行 Resilience4j 的自定义配置:

resilience4j:
  circuitbreaker:
    configs:
      custom:
        slidingWindowSize: 50
        minimumNumberOfCalls: 5

要使用自定义 Circuit Breaker 配置,您需要用 @CircuitBreaker(name = "custom") 注解你的方法。这将指定配置应用于方法的 Circuit Breaker 实例。

性能优化

优化 Resilience4j 在生产环境中的性能:

  • 调整配置参数以平衡性能和稳定性
  • 使用异步调用减少阻塞

问题排查

常见问题及其解决方案:

  • 问题:Circuit Breaker 不工作

解决方案:检查配置是否正确,确保服务调用符合触发条件。

六、结语

Resilience4j 提供了一套强大的工具,使你的 Spring Boot 应用更具弹性和可靠性。通过整合 Resilience4j,可以有效地应对各种服务故障和过载情况。随着 Resilience4j 的不断发展,我们可以期待更多功能和优化,使其在微服务架构中发挥更大的作用。

责任编辑:赵宁宁 来源: 源话编程
相关推荐

2022-11-16 17:16:41

spring限流

2024-10-06 08:35:44

2023-06-27 07:31:59

微服务容错库重试

2023-03-13 08:02:55

断路器应用API

2022-04-27 08:55:01

Spring外部化配置

2022-03-07 07:33:24

Spring自定义机制线程池

2021-06-15 07:33:13

Java函数式编程

2020-05-25 07:00:00

双因素认证身份认证密码

2022-02-15 08:22:28

Neo4jSpring数据库

2021-12-11 13:29:36

SpringBoot 官方

2022-07-26 16:54:08

QuartzJava

2024-12-03 08:00:00

2017-05-09 10:34:21

Spring BootDubbo Activ扩展

2013-05-21 10:58:43

Log4jActiveMQSpring

2024-09-05 09:35:58

CGLIBSpring动态代理

2024-10-10 15:08:40

2023-03-01 13:54:53

Springpostion​继承

2022-03-25 13:42:15

Log4j漏洞网络安全

2025-01-13 12:46:31

SpringBootJacksonJSON

2024-04-18 09:34:28

Reactor项目异步编程
点赞
收藏

51CTO技术栈公众号