有些线程跑着跑着就不见了

开发 前端
凭着老程序员的经验,猜到可能是异步线程内发生了异常,导致异步线程退出,不再继续执行。而又因为上述代码「吃掉」了异常,这就导致我们从外部看起来这个工程跑着跑着就不动了,日志什么也没了。

[[377581]]

本文转载自微信公众号「小黑十一点半」,作者楼下小黑哥。转载本文请联系小黑十一点半公众号。   

前言

Hello,大家好,我是楼下小黑哥~

最近接了一个业务需求,需求倒是不难,三下五除二就整理出设计方案,然后就开始代码改造。

啪,很快,就完成代码改造,然后提测给测试小姐姐。

小姐姐前面测试好好的,测到这个工程的时候,突然跟我反馈,你看这个这个工程跑着跑着就不动了,日志什么也没了。

那时候正在忙,想着我就没改几行代码,也没涉及核心逻辑,那肯定没问题的。

于是回复小姐姐,业务逻辑执行的太慢了吧,再等个半小时再看看?

一小时后,小姐姐又来找我,我都等了一小时,这个工程还是没动啊,日志还是没有啊。

这下不能拖了,上去仔细一看,还真是,怎么就没了呢?

先简单说下这段代码,就是使用一个异步线程执行一段业务逻辑,示例代码如下:

  1. // 前置逻辑 
  2. ..... 
  3. Thread thread=new Thread(new Runnable() { 
  4.     @Override 
  5.     public void run() { 
  6.         try { 
  7.            // 异步线程执行其他业务逻辑 
  8.         } catch (Exception e) { 
  9.            // 不进行任何代码处理 
  10.         } 
  11.     } 
  12. }); 
  13. thread.start(); 

凭着老程序员的经验,猜到可能是异步线程内发生了异常,导致异步线程退出,不再继续执行。而又因为上述代码「吃掉」了异常,这就导致我们从外部看起来这个工程跑着跑着就不动了,日志什么也没了。

于是改造了一下,打印出相关异常日志,最终定位问题,原来是小姐姐造的数据存在问题,从而引发 NPE 问题。

「不知道大家有没有碰到过上面的情况,使用线程异步执行相关逻辑,但是执行到一半突然就像卡主一般,不再继续往下执行。」

小黑哥碰到过几次,这几次原因都不太相同,总结起来分为下面三种情况:

  • 异步任务长时间被阻塞
  • 异步任务发生异常
  • 异步任务异常被吃掉

异步任务长时间被阻塞

第一种,异步线程执行任务,这个任务需要通过网络调用其他远端服务。假设服务端响应的非常慢,而我们设置的网络超时时间又很长,这就会导致这个线程长时间被阻塞。

假设异步任务伪码如下:

  1. ThreadPoolExecutor threadPool= ....; 
  2. threadPool.execute(() -> { 
  3. // 1.调用远端服务 
  4. Socket socket....; 
  5. // 2.设置超时时间 
  6. socket.setSoTimeout(60*1000); 
  7. // 3.读取服务端返回 
  8. socket.read(); 
  9. }); 

上面程序中,如果服务端一直没有返回,那么异步线程将会一直被阻塞,直到超时。

这种情况其实还好,我们无非等待一段时间,就可以看到异步线程继续往下执行任务。

举一个极端的例子,假设上面的代码没有设置超时时间,而服务端一直没有返回响应,「此时异步线程就会被一直阻塞」。

除了上面网络读取阻塞的例子,常见情况还有

  • 执行了长时间休眠,比如 TimeUnit.MINUTES.sleep(60)
  • 内部发生了死锁
  • 等等

如果异步线程长时间被阻塞,而异步任务执行又比较频繁,那么线程池内可用线程将会被慢慢耗尽,此时后续任务就会被拒绝执行。

解决办法

其实非常简单,首先我们使用 jstack 命令 「dump」 一下当前 Java 应用的线程堆栈情况,然后根据线程池名字定位相关线程即可。

网上随便找了堆栈图

如果没有自定义线程池 ThreadFactory 参数,那查找定位被阻塞线程就比较麻烦了。

所以创建线程池建议自定义 ThreadFactory 参数,这对于后期排查问题非常有用。

异步任务异常未捕获

上面的情况,异步线程其实还活着,只是被阻塞没办法执行后续的逻辑。

那这一类情况呢,与上面不太一样,由于异步任务内部发生错误,抛出异常,而代码逻辑中又没有进行捕获处理,从而导致线程提前异常退出。

异常退出伪码如下:

  1. // 1.创建执行的任务 
  2. Runnable runnable=new Runnable() { 
  3.     @Override 
  4.     public void run() { 
  5.        // 执行前置逻辑 
  6.         // 抛出异常 
  7.         int i=100/0; 
  8.        // 执行后置逻辑 
  9.          
  10.     } 
  11. }; 
  12. // 2.创建线程 
  13. Thread thread=new Thread(runnable); 
  14. // 3.运行异步线程 
  15. thread.start(); 
  16. // 其他业务逻辑 

上述代码中,异步线程执行到除零逻辑,将会抛出异常,然后异步线程将会异常退出。

「异步线程内抛出的异常日志仅仅只会被打印到控制台,而不会被记录到日志文件中。」

所以正常的业务日志中是见不到线程异常的日志,这就给了我们一种假象,异步线程看起来还在执行任务,其实它已经挂了。

PS:上面的话可能不好理解,举个例子,如果你使用 IDEA 执行上面这段程序,异常日志将会被输出到 IDEA 下方控制台。

而如果我们在 Linux 机器上执行这段程序,异常日志仅仅只会显示在当前终端窗口上,一旦关闭当前终端窗口,日志就没。了。

如果想要保存这种日志,我们需要将 stdout 重定向到日志文件中,比如执行以下命令:

  1. -- 将 stdout 重定向输出到文件中 
  2. nohup java  xxxx > $STDOUT_FILE 2>&1 & 

解决办法

第一种解决办法,其实很多读者已经想到了,异步线程内使用 try..catch 语句捕获所有异常即可。

「没错,就是这么简单。」

不过这里提一点,一般我们使用 try..catch仅仅只会捕获 Exception异常。

那么极端情况下,异步线程内如果抛出 Error,比如抛出了 java.lang.NoClassDefFoundError,此时是没法捕获,异步线程依旧会异常退出。

所以我们可以使用try..catch捕获 Throwable,这样及时发生 Error错误,也会被捕获。

不过个人觉得捕获Exception异常就够了,正常工程应用很少会发生 Error错误,所以我们只要了解有这个可能即可。

ps:之前同事上线一个应用,使用异步线程执行任务,每次执行到一半,都不再继续执行。

由于异步线程内使用try..catch捕获处理了 Exception异常,所以找了半天不知道什么问题。

最后,小黑哥排查 stdout 输出日志,才发现异步线程发生 Error错误。

这种解决本法需要我们主动去捕获异常,而下面第二种解决办法,设置线程异常处理方法。

一旦设置完成,如果异步线程内发生异常,线程退出之前将会调用异常处理方法。

我们拿 Thread 来讲,其设置方法如下:

  1. Runnable runnable=new Runnable() { 
  2.     @Override 
  3.     public void run() { 
  4.         int i=100/0; 
  5.     } 
  6. }; 
  7.  
  8. Thread thread=new Thread(runnable); 
  9. thread.setUncaughtExceptionHandler(new Thread.UncaughtExceptionHandler() { 
  10.     @Override 
  11.     public void uncaughtException(Thread t, Throwable e) { 
  12.         System.out.println(t.getName()+"发生异常"+e.getMessage()); 
  13.     } 
  14. }); 
  15. thread.start(); 

不过生产环境不建议直接使用 Thread,我们需要使用线程池代替。

线程池设置异常处理方法可以分为两种,如果我们使用 ThreadPoolExecutor#execute执行异步任务,那我们需要在自定义线程池的时候,使用 ThreadFactory 设置。

  1. ThreadPoolExecutor threadPool =new ThreadPoolExecutor( 
  2.         5, 
  3.         10, 
  4.         60, 
  5.         TimeUnit.SECONDS,new ArrayBlockingQueue<>(100), 
  6.       // 这里使用 Guava 的 ThreadFactoryBuilder 类,方便构造 ThreadFactory 
  7.         new ThreadFactoryBuilder().setUncaughtExceptionHandler(new Thread.UncaughtExceptionHandler() { 
  8.             @Override 
  9.             public void uncaughtException(Thread t, Throwable e) { 
  10.                 // 处理异常 
  11.             } 
  12.         }).build() 
  13.         ); 

如果你当前使用 ThreadPoolExecutor#submit执行异步任务,那就简单了,我们可以直接通过 Future#get获取到线程内抛出的异常。

  1. Future<?> future = threadPool.submit(new Callable<Object>() { 
  2.     @Override 
  3.     public Object call() throws Exception { 
  4.         return "小黑十一点半"
  5.     } 
  6. }); 
  7.  
  8. try { 
  9.     future.get(); 
  10. } catch (InterruptedException e) { 
  11.     e.printStackTrace(); 
  12. } catch (ExecutionException e) { 
  13.     // 线程内抛出异常将会被封装在 ExecutionException 内 

异步任务异常被吃掉

好了,终于到最后一种情况了,小黑哥这次碰到就是这种??。

这种情况具体来说就是异步线程内使用 try..catch 语句捕获了所有异常,但是没有在 catch语句中进行任何代码处理。

  1. Thread thread=new Thread(new Runnable() { 
  2.     @Override 
  3.     public void run() { 
  4.         try { 
  5.             int i=100/0; 
  6.         } catch (Exception e) { 
  7.            // 不进行任何代码处理 
  8.         } 
  9.     } 
  10. }); 
  11. thread.start(); 

如上述代码所示,catch语句中没有进行任何代码处理。即使异步线程内真发生了异常,也不会有任何提示,这个异常就像被吃掉一般。

总结

多线程编程原本就比较复杂,我们需要处理各种问题,那今天主要介绍了一下其中的一个问题:

「异步线程突然停止,就像卡主一般,不再继续执行代码逻辑,没有任何响应」

那这类问题,小黑哥根据自己碰到情况,总结为三类:

  • 异步任务长时间被阻塞
  • 异步任务异常
  • 异步任务异常被吃掉。

对于第一种,我们在网络编程中及时设置超时时间,一般都能避免。

对于第二、第三种情况,这就需要我们建立一个良好的编程习惯,使用try..catch 捕获所有异常,并且 catch块中一定做一些处理,比如说打印相关日志。

 

责任编辑:武晓燕 来源: 小黑十一点半
相关推荐

2017-01-18 20:29:00

Windows 10启动栏解决方案

2021-12-02 22:27:30

Windows 11Windows微软

2014-12-26 10:01:04

架构

2020-12-17 12:25:54

Java进程内存

2021-10-15 20:24:19

AI

2021-04-28 17:01:18

Windows 10Windows微软

2017-06-07 15:16:03

Windows 10Windows以太网图标

2020-12-03 19:49:21

微信表情移动应用

2024-01-15 16:34:13

模型训练

2021-06-03 21:13:03

内存Python管理

2021-12-19 07:25:10

Windows 11操作系统微软

2023-03-15 16:24:43

云数据库代码开发

2021-03-01 06:28:17

微信表情腾讯

2021-10-29 06:46:42

CPU缓存TLB

2021-09-16 18:29:17

CPU缓存虚拟

2023-09-13 07:23:22

显卡NVIDIAIntel

2011-08-17 15:08:08

windows7任务栏缩略图

2011-11-18 10:40:16

Windows活动目录DNS记录

2011-11-16 11:12:46

DNSDNS记录DNS恢复

2015-07-06 09:51:39

点赞
收藏

51CTO技术栈公众号