线程池异常黑洞及其防范策略

开发 前端
当使用 submit 提交任务时,会返回 Futrue 对象,通过 Future 的 get 方法便可以获取任务运行的异常信息,但这样会阻塞主线程导致接口响应时间过长。

1. 问题&分析

迭代刚上线,小艾同学又接到了一线业务的投诉,一起看下本次遇到的又是什么问题。

1.1. 案例

上周接到一个需求,需要对系统中的核心操作增加操作日志,也就是在操作完成后对操作人、操作时间等信息进行详细记录。核心包括:创建订单、取消订单、删除订单、修改价格等。

在需求分析时,小艾做了深度思考:记录操作日志不能影响正常的业务操作,比如创建订单,哪怕是操作日志记录失败,也不能导致下单失败。

当然,方案1便是,记录日志的逻辑使用 try-catch 进行处理,哪怕是抛出异常也不能影响原来的主流程。

图片图片

这样做确实能控制住异常,但由于是在主线程中运行,这样会导致整个流程的处理时间加长。这时,小艾想起了线程池的异常操作,整体如下:

图片图片

这个方案好处多多:

  1. 可以非常好对异常进行隔离,任务执行发生异常也不会影响主流程
  2. 操作日志在线程池中异步处理,不会占用主线程的时间,整体操作时间变化不大

核心代码如下:

@GetMapping("createOrder")
public RestResult<String> createOrder(Integer taskId){
    log.info("begin to create Order {}", taskId);
    // 创建订单
    doCreateOrder(taskId);
    log.info("end to create Order {}", taskId);

    // 异步保存操作日志
    log.info("Begin to Submit Task {}", taskId);
    this.executorService.execute(new SaveOperationLogTask(taskId));
    log.info("Success to Submit Task {}", taskId);
    return RestResult.success("提交成功");
}

// 保存操作日志 Task
@Slf4j
public class SaveOperationLogTask implements Runnable {
    // 省略部分代码
    @Override
    public void run() {
        log.info("Begin to save operation");
        // 保存日志
        saveLog();
        log.info("Success to Run task {}", this.taskId);
    }

    private void saveLog() {
        // 实际执行业务逻辑,保存到数据库
    }
}

在收到业务反馈时,小艾第一时间查看日志,居然没有找到任何异常信息。难道是业务反馈信息有问题?根据业务提供的订单号,在数据库中确实没有找到操作记录,好奇怪呀。

从日志中提取出 正常 和 异常 信息,分别如下:

正常日志:

图片图片

可以看出:

  1. 在主线程中完成创建订单和提交任务操作
  2. 在线程池线程中完成操作日志保存操作
  3. 在数据库中能看到详细的操作信息

异常日志:

图片图片

可以看出少了些信息:

  1. 主线程操作没有变化,完成了创建订单和提交任务操作
  2. 线程池线程只打印了开始执行的日志,未见到执行成功日志
  3. 数据中也没有操作信息

对比日志可见,==保存操作日志的任务执行失败,同时系统没有抛出任何异常!!!==

1.2. 问题分析

核心还是对 线程池的核心 API 不熟悉,当使用 `execute()` 方法提交任务时,异常信息不会直接抛出给调用者。这是因为线程池处理任务的方式是,将这些任务封装到一个 `Runnable` 中去执行。`Runnable.run()` 方法没有任何抛出异常的声明,所以在运行 `Runnable` 时产生的异常只会被内部捕获,不会抛出。

线程池中提供两者函数:

  1. `execute()` 方法用于提交不需要返回值的任务,所以无法判断任务是否被线程池成功执行。
  2. `submit()` 方法用于提交需要返回值的任务。线程池会返回一个 future 类型的对象,通过这个 future 对象可以判断任务是否执行成功。

2. 解决方案

最大困扰原因是:出问题后没有任何信息。所以对应的解决方案便是:让系统能够打印异常栈暴露异常原因。

2.1. 手工抛出异常

最简单方式便是,在Task代码中通 try-catch 手工捕获并打印异常日志。

详细代码如下:

@Slf4j
public class SaveOperationLogTask1 implements Runnable {
    // 省略非核心代码
    @Override
    public void run() {
        try {
            int result = RandomUtils.nextInt() / this.taskId;
            log.info("Success to Run task {}", this.taskId);
        }catch (Exception e) {
            log.error("failed to run task {}", taskId, e);
        }
    }
}

当出现异常数据时,日志如下:

图片图片

可以看出,从 SaveOperationLogTask1 类中清楚的打印异常信息。

2.2. 封装 Runnable 统一管理异常

每个 Task 都手工添加 try-catch 逻辑,不仅工作量大也非常容易出现遗漏场景,我们需要一个更好的方案。

可以构建一个 Runnable 的封装类来对异常进行统一处理,详细代码如下:

@Slf4j
public class LogBasedTaskWrapper implements Runnable {
    private final Runnable runnable;

    public LogBasedTaskWrapper(Runnable runnable) {
        this.runnable = runnable;
    }

    @Override
    public void run() {
        try {
            this.runnable.run();
        }catch (Exception e) {
            log.error("Filed to run task {}", runnable, e);
        }
    }
}

// 在提交任务时,使用 LogBasedTaskWrapper 对 Task 进行封装即可
log.info("Begin to Submit Task {}", taskId);
Runnable task = new SaveOperationLogTask(taskId);
this.executorService.execute(new LogBasedTaskWrapper(task));
log.info("Success to Submit Task {}", taskId);

当出现异常数据时,日志如下:

图片图片

可以看出,从 LogBasedTaskWrapper 类中清楚的打印异常信息。

2.3. 定制化线程工厂

Wrapper 机制不错,但需要对 Task 进行封装操作,还是容易被遗漏,我们还需要更简单的方式。

可以对线程池的线程工厂进行定制,对为捕获异常进行特殊处理,详细代码如下:

executorServiceV2 = new ThreadPoolExecutor(4, 4,
        0L, TimeUnit.MILLISECONDS,
        new LinkedBlockingQueue<Runnable>(20),
        new BasicThreadFactory.Builder()
                .namingPattern("BlackHole_thread-%d")
                // 设置为捕获异常处理器
                .uncaughtExceptionHandler((t, e) -> log.error("Failed to run task", e))
                .build(),
        new ThreadPoolExecutor.AbortPolicy());

// 然后使用 executorServiceV2 即可
// 异步保存操作日志
log.info("Begin to Submit Task {}", taskId);
this.executorServiceV2.execute(new SaveOperationLogTask(taskId));
log.info("Success to Submit Task {}", taskId);

核心代码就一句:.uncaughtExceptionHandler((t, e) -> log.error("Failed to run task", e))。当出现未捕获异常时,会统一被 UncaughtExceptionHandler 处理。详细日志如下:

图片图片

从日志中看到,从 ExceptionBlackHoleFixController 类中对异常进行处理。

这是一劳永逸的方法,也是最鼓励的方法。

2.4. 使用 CompletableFuture

当使用 submit 提交任务时,会返回 Futrue 对象,通过 Future 的 get 方法便可以获取任务运行的异常信息,但这样会阻塞主线程导致接口响应时间过长。

这种情况下,可以使用更高级的 CompletableFuture,向 CompletableFuture 设置异常处理器后,出现异常时会自动调用处理器,核心代码如下:

// 异步保存操作日志
log.info("Begin to Submit Task {}", taskId);
CompletableFuture<Void> completableFuture = CompletableFuture.runAsync(new SaveOperationLogTask(taskId), this.executorService);
completableFuture.exceptionally(e -> {
        log.error("Failed to Submit Task", e);
        return null;
    }
);
log.info("Success to Submit Task {}", taskId);

当出现异常数据时,日志如下:

图片图片

image

从日志中看到,从 ExceptionBlackHoleFixController 类中对异常进行处理。

3. 示例&源码

代码仓库:https://gitee.com/litao851025/learnFromBug

代码地址:https://gitee.com/litao851025/learnFromBug/tree/master/src/main/java/com/geekhalo/demo/thread/exceptionblackhole


责任编辑:武晓燕 来源: geekhalo
相关推荐

2020-11-25 11:33:47

Java线程技术

2020-07-08 12:05:55

Java线程池策略

2024-10-09 15:58:02

2024-09-13 09:06:22

2020-02-18 14:25:51

Java线程池拒绝策略

2023-12-29 09:38:00

Java线程池

2012-02-13 17:26:35

2022-11-24 09:00:00

2013-05-09 09:13:41

2022-03-14 07:32:06

线程池拒绝策略自定义

2023-05-19 08:01:24

Key消费场景

2011-09-05 10:40:45

2024-07-15 08:20:24

2024-02-04 08:26:38

线程池参数内存

2020-12-10 08:24:40

线程池线程方法

2012-05-15 02:18:31

Java线程池

2010-01-30 11:23:59

2014-06-06 09:30:07

2016-09-01 21:19:55

2023-12-11 14:19:00

Java程序异常
点赞
收藏

51CTO技术栈公众号