如何排查Java应用的死锁-java死锁

首先，我们构造一个死锁场景。

如何构造一个死锁呢?

很简单，只要让线程1占有对象a的锁后，再去请求对象b的锁。与此同时，对象2已经占有了对象b的锁，再请求对象a的锁。线程1与线程2互相等待，形成了死锁。(在面试中，也会被经常地要求手写死锁)

代码如下：

package com.example.dl; 
 
import org.springframework.web.bind.annotation.RequestMapping; 
import org.springframework.web.bind.annotation.RestController; 
 
@RestController 
public class Controller { 
 
    @RequestMapping("/test") 
    public String testDeadLock() { 
 
        final Object a = new Object(); 
        final Object b = new Object(); 
 
        new Thread(() -> { 
            synchronized (a) { 
                System.out.println(Thread.currentThread().getName() + "占有了对象a的锁"); 
                try { 
                    Thread.sleep(1000); 
                } catch (InterruptedException e) { 
                    e.printStackTrace(); 
                } 
                System.out.println(Thread.currentThread().getName() + "请求对象b的锁"); 
                synchronized (b) { 
                    System.out.println(Thread.currentThread().getName() + "占有了对象b的锁"); 
                } 
            } 
        }, "Thread 1").start(); 
 
        new Thread(() -> { 
            synchronized (b) { 
                System.out.println(Thread.currentThread().getName() + "占有了对象b的锁"); 
                try { 
                    Thread.sleep(1000); 
                } catch (InterruptedException e) { 
                    e.printStackTrace(); 
                } 
                System.out.println(Thread.currentThread().getName() + "请求对象a的锁"); 
                synchronized (a) { 
                    System.out.println(Thread.currentThread().getName() + "占有了对象a的锁"); 
                } 
            } 
        }, "Thread 2").start(); 
 
        return "success"; 
    } 
}

输出如下：

如果不施加干预，两个线程将会一直僵持着。

这个只是一个简单的死锁场景，如果线上发生这样的情况，该去如何定位呢?

我们把死锁代码放进一个简单的SpringBoot中

使用mvn install打包后，将打好的jar包放进我们实验的机器中，我的项目名称就叫做dl

使用nohup java -jar dl-0.0.1-SNAPSHOT.jar & 部署运行

使用curl http:port/test调用接口，不出意外的话，现在程序发生了死锁。

首先获取到该java应用的进程，ps -ef | grep dl | grep -v grep，获取到pid为12156

接着打印出该进程下线程的状态，并输出到dl.txt中，jstack 12156 > dl.txt

jstack可以用来生成虚拟机当前的线程快照，快速定位多线程使用不当引发的问题。

在该txt文件的末尾，我们可以看到以下的内容：

Found one Java-level deadlock: 
============================= 
"Thread 2": 
  waiting to lock monitor 0x00007f9ea8006008 (object 0x00000000e367d550, a java.lang.Object), 
  which is held by "Thread 1" 
"Thread 1": 
  waiting to lock monitor 0x00007f9ea8003f08 (object 0x00000000e367d560, a java.lang.Object), 
  which is held by "Thread 2" 
 
Java stack information for the threads listed above: 
=================================================== 
"Thread 2": 
    at com.example.dl.Controller.lambda$testDeadLock$1(Controller.java:40) 
    - waiting to lock <0x00000000e367d550> (a java.lang.Object) 
    - locked <0x00000000e367d560> (a java.lang.Object) 
    at com.example.dl.Controller$$Lambda$469/1627217364.run(Unknown Source) 
    at java.lang.Thread.run(Thread.java:748) 
"Thread 1": 
    at com.example.dl.Controller.lambda$testDeadLock$0(Controller.java:25) 
    - waiting to lock <0x00000000e367d560> (a java.lang.Object) 
    - locked <0x00000000e367d550> (a java.lang.Object) 
    at com.example.dl.Controller$$Lambda$468/117875601.run(Unknown Source) 
    at java.lang.Thread.run(Thread.java:748) 
 
Found 1 deadlock.

可以清晰地看到，Thread 2请求一把被Thread 1占有的锁，而Thread 1请求一把被Thread 2占有的锁，这样就构成了死锁。

当然，这个场景非常的简单，但是线上环境错综复杂，在接口响应越来越慢、cpu负载越来越高的时候，可以使用jstack命令，查看java进程内线程的状态，看是否有死循环、死锁等。

然后根据具体情况具体分析，比方说按照顺序获得对象的锁，只能是从a到b的顺序，线程1获取a对象的锁后，尝试去获取b对象的锁时，线程2想要直接获取b对象的锁，则首先要获取对象a的锁，从而被线程1阻塞，等到线程1运行结束，释放所有的锁后，线程2才可以继续运行。

或者说超时直接放弃，换synchronized为ReentranLock，使用其带有时间的tryLock方法，一定时间内获取不到锁，直接放弃本次对锁的申请。