Android 主线程崩溃与子线程崩溃有什么本质区别?你是怎么处理的?

移动开发 Android
子线程崩溃就是正常的 Java thread 样子,通过 setDefaultUncaughtExceptionHandler 就能捕获 ThreadGroup 里对应子线程的异常做后续处理(启动独立进程提醒用户并上报平台等,或者通过策略下发忽略特定异常当作没发生一样)。

[[358857]]

问答环节

问:Android 主线程崩溃与子线程崩溃有什么本质区别?

答:子线程崩溃就是正常的 Java thread 样子,通过 setDefaultUncaughtExceptionHandler 就能捕获 ThreadGroup 里对应子线程的异常做后续处理(启动独立进程提醒用户并上报平台等,或者通过策略下发忽略特定异常当作没发生一样)。安卓中主线程的 Crash 和子线程 Crash 有一点差异,虽然本质都是通过 setDefaultUncaughtExceptionHandler 就能捕获,但是这背后其实是有一点窍门的。由于 Android 主线程启动后通过 MainHandler 的 Looper.loop() 一直保持管道阻塞式的生产消费者死循环,所有的主线程代码都是通过这个循环派发在 MainLooper 中执行的,所以当主线程 crash 的场景下,这个循环会被跳出,导致 Looper 无法再继续执行其中的其他 Message,所以当主线程 crash 时会出现几种不同的表现,场景的一种就是在 Activity 的 onCreate 中 crash 会导致界面黑屏(注意,这种 crash 不是 anr,是因为 onCreate 中抛出异常导致后续代码无法执行,也就是 Activity 生命周期框架代码无法继续,同时后续 Message 也无法正常派发,所以界面还没出来就黑屏了),而 View 点击事件响应中 crash 可能不会黑屏(也可能会,取决于做什么操作),但是后续 Message 也是无法正常派发。

拓展环节
问:针对上面描述你有什么想法?

答:子线程奔溃没啥说的,由于主线程发生了崩溃会导致 Looper 退出,所以我们可以在主线程启动一个我们自带 try-catch 的 Looper.loop() 去执行主线程任务,相当于这样我们通过带 try-catch 的 loop() 替换掉了 ActivityThread main 里面那个 Looper.loop(),这样就不会出现主线程崩溃后 loop 退出了,也就能继续执行代码了,只是当次 crash 的场景可能是无效的,譬如用户点击按钮设置文案 crash 了,点了可能没反应;同时点击按钮启动的 Activity 的 onCreate 等方法里面有 crash 则会导致黑屏,所以这种 crash 需要区分对待(譬如上报异常并弹框提醒并直接杀掉进程等)。

下面是核心代码的简单实现(Activity 生命周期处理的比较粗略,仅供 demo):

  1. // Application 启动就进行替换 
  2. new Handler(getMainLooper()).post(new Runnable() { 
  3.     @Override 
  4.     public void run() { 
  5.         // 每次蹦了就继续重新循环,保证永远都能 loop 
  6.         while (true) { 
  7.             try { 
  8.                 Looper.loop(); 
  9.             } catch (Throwable e) { 
  10.                 e.printStackTrace(); 
  11.                 // TODO 手动上报错误到异常管理平台,做交互处理等 
  12.                 if (e.getMessage() != null && e.getMessage().startsWith("Unable to start activity")) { 
  13.                     // TODO 来自 Activity 生命周期崩溃,杀死进程 
  14.                     android.os.Process.killProcess(android.os.Process.myPid()); 
  15.                     break; 
  16.                 } 
  17.             } 
  18.         } 
  19.     } 
  20. }); 


当然,针对 Activity 生命周期方法内的 crash 黑屏我们除过判断堆栈日志方式,还能通过 hook ActivityThread 的 mH 主 Handler 实现,将里面的 Message handle 函数托管我们实现,然后进行 try-catch 捕获,发现异常就 close 对应 Activity 或者 kill app 即可,这个方案其实网上有现成的开源库,大家可以去参考下。

本文转载自微信公众号「码农每日一题」,可以通过以下二维码关注。转载本文请联系码农每日一题公众号。 

 

责任编辑:武晓燕 来源: 码农每日一题
相关推荐

2010-03-01 13:28:44

Python子线程

2022-06-15 09:02:32

JVM线程openJDK

2024-09-13 09:06:22

2010-02-24 11:19:00

Python主线程

2011-05-25 13:10:40

SQL ServerOracle

2021-07-02 06:54:45

GoJavachannel

2022-03-16 07:33:40

守护线程用户线程语言

2024-07-15 08:20:24

2011-05-27 09:19:32

Windows 7崩溃

2022-03-23 07:54:05

Java线程池系统

2015-12-17 11:36:31

资本寒冬互联网创业

2010-09-27 11:24:37

SQL聚簇索引

2009-07-12 13:55:29

2024-10-24 08:47:12

2021-12-30 09:39:28

Android 12App开发者

2014-07-23 10:53:30

听云应用监控

2017-05-27 09:58:42

BGP动态静态

2018-02-06 14:32:03

云服务器本质区别

2020-09-03 06:42:12

线程安全CPU

2023-12-11 08:03:01

Java线程线程组
点赞
收藏

51CTO技术栈公众号