如何分析Java虚拟机死锁

开发 后端
作者认为分析Java代码问题的最有效的工具仍然是java thread dump,并且认为通常情况下分析Java虚拟机死锁比分析内存泄漏要容易的多,本文针对Java虚拟机死锁问题进行了分析。

到目前为止,我认为分析Java代码问题的最有效的工具仍然是java thread dump,原因是:

1.任何操作系统平台下都可以使用。

2.在多数情况下,可以在生产环境中使用。

3.和操作系统提供的工具相比,java thread dump给出的信息是直白的,直接对应到应用代码。

4.它对被分析的系统干扰很小,因此能反应真实的问题。而其它很多profiling或Instrument工具本身对JVM运行有很大的干扰,经常不能暴露出真正的问题,而且这种工具不能用于生产系统。


我觉得在通常情况下分析Java虚拟机死锁比分析内存泄漏要容易的多。因为死锁发生时,JVM通常处于挂起状态(hang住了),thread dump可以给出静态稳定的信息,查找死锁只需要查找有问题的线程。而内存泄漏的问题却很难界定,一个运行的JVM里有无数对象存在,只有写程序的人才知道哪些对象是垃圾,而哪些不是,而且对象的引用关系非常复杂,很难得到一份清晰的对象引用图。

Java虚拟机死锁发生时,从操作系统上观察,虚拟机的CPU占用率为零,很快会从top或prstat的输出中消失。这时你就可以收集thread dump了,Unix/Linux 下是kill -3 <JVM pid>,在Windows下可以在JVM的console窗口上敲Ctrl-Break。根据不同的设置,thread dump会输出到当前控制台上或应用服务器的日志里。

拿到java thread dump后,你要做的就是查找"waiting for monitor entry"的thread,如果大量thread都在等待给同一个地址上锁(因为对于Java,一个对象只有一把锁),这说明很可能死锁发生了。比如:

"service-j2ee" prio=5 tid=0x024f1c28 nid=0x125 waiting for monitor entry  
[62a3e000..62a3f690]  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
com.sun.enterprise.resource.IASNonSharedResourcePool.internalGetResource(IASNonS  
haredResourcePool.java:625)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: - waiting to  
lock <0x965d8110> (a com.sun.enterprise.resource.IASNonSharedResourcePool)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
com.sun.enterprise.resource.IASNonSharedResourcePool.getResource(IASNonSharedRes  
ourcePool.java:520)  
................ 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.


为了确定问题,常常需要在隔两分钟后再次收集一次thread dump,如果得到的输出相同,仍然是大量thread都在等待给同一个地址上锁,那么肯定是死锁了。

如何找到当前持有锁的线程是解决问题的关键。方法是搜索thread dump,查找"locked <0x965d8110>", 找到持有锁的线程。


 

[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: "Thread-20" daemon prio=5 tid=0x01394f18 
nid=0x109 runnable [6716f000..6716fc28]  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
java.net.SocketInputStream.socketRead0(Native Method)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
java.net.SocketInputStream.read(SocketInputStream.java:129)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at oracle.net.ns.Packet.receive(Unknown  
Source)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.net.ns.DataPacket.receive(Unknown Source)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.net.ns.NetInputStream.getNextPacket(Unknown Source)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.net.ns.NetInputStream.read(Unknown Source)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.net.ns.NetInputStream.read(Unknown Source)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.net.ns.NetInputStream.read(Unknown Source)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.jdbc.ttc7.MAREngine.unmarshalUB1(MAREngine.java:929)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.jdbc.ttc7.MAREngine.unmarshalSB1(MAREngine.java:893)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.jdbc.ttc7.Ocommoncall.receive(Ocommoncall.java:106)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.jdbc.ttc7.TTC7Protocol.logoff(TTC7Protocol.java:396)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: - locked <0x954f47a0> (a  
oracle.jdbc.ttc7.TTC7Protocol)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
oracle.jdbc.driver.OracleConnection.close(OracleConnection.java:1518)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: - locked <0x954f4520> (a  
oracle.jdbc.driver.OracleConnection)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
com.sun.enterprise.resource.JdbcUrlAllocator.destroyResource(JdbcUrlAllocator.java:122)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
com.sun.enterprise.resource.IASNonSharedResourcePool.destroyResource(IASNonSharedResourcePool.java:8 
72)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
com.sun.enterprise.resource.IASNonSharedResourcePool.resizePool(IASNonSharedResourcePool.java:1086)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: - locked <0x965d8110> (a  
com.sun.enterprise.resource.IASNonSharedResourcePool)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
com.sun.enterprise.resource.IASNonSharedResourcePool$Resizer.run(IASNonSharedResourcePool.java:1178)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
java.util.TimerThread.mainLoop(Timer.java:432)  
[27/Jun/2006:10:03:08] WARNING (26140): CORE3283: stderr: at  
java.util.TimerThread.run(Timer.java:382
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.


在这个例子里,持有锁的线程在等待Oracle返回结果,却始终等不到响应,因此发生了死锁。

如果持有锁的线程还在等待给另一个对象上锁,那么还是按上面的办法顺藤摸瓜,直到找到死锁的根源为止。

另外,在thread dump里还会经常看到这样的线程,它们是等待一个条件而主动放弃锁的线程。
例如:

"Thread-1" daemon prio=5 tid=0x014e97a8 nid=0x80 in Object.wait() [68c6f000..68c6fc28]  
at java.lang.Object.wait(Native Method)  
- waiting on <0x95b07178> (a java.util.LinkedList)  
at com.iplanet.ias.util.collection.BlockingQueue.remove(BlockingQueue.java:258)  
- locked <0x95b07178> (a java.util.LinkedList)  
at com.iplanet.ias.util.threadpool.FastThreadPool$ThreadPoolThread.run(FastThreadPool.java:241)  
at java.lang.Thread.run(Thread.java:534
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.


有时也会需要分析这类线程,尤其是线程等待的条件。

其实,Java thread dump并不只用于分析死锁,其它Java应用运行时古怪的行为都可以用thread dump来分析。

***,在Java SE 5里,增加了jstack的工具,也可以获取thread dump。在Java SE 6里, 通过jconsole的图形化工具也可以方便地查找涉及object monitors 和java.util.concurrent.locks死锁。

 

【编辑推荐】

  1. 20个开发人员非常有用的Java功能代码
  2. 走进Java 7中的模块系统
  3. JavaFX 1.2 已经发布 主要新功能一览
  4. 2009年十大Java技术解决方案
  5. 2008最值得学习的五种JAVA技术
     
责任编辑:仲衡 来源: yuzhou的空间
相关推荐

2021-01-26 09:30:32

加密虚拟机攻击

2012-04-10 10:29:29

2010-12-23 14:05:12

虚拟机

2017-03-01 20:08:36

PHP内核分析

2019-03-05 14:59:42

Java虚拟机加载类

2012-05-18 10:22:23

2022-08-14 09:11:13

Kubernetes容器云原生

2012-08-16 09:07:57

Erlang

2010-09-17 15:12:57

JVMJava虚拟机

2010-07-26 09:02:38

2013-07-17 09:32:58

2020-06-03 19:07:49

Java虚拟机JVM

2021-09-10 00:34:22

Java 线程启动

2010-02-26 15:28:15

Python虚拟机

2013-04-07 09:52:40

Ubuntu虚拟机虚拟化软件

2009-06-29 19:36:07

虚拟机备份虚拟环境

2012-04-27 09:29:57

虚拟化虚拟机

2013-11-19 14:05:08

VDP虚拟机

2018-07-10 15:10:50

OpenStack虚拟机metadata

2009-08-18 21:57:59

点赞
收藏

51CTO技术栈公众号