如何排查和解決死鎖?
死鎖(Dead Lock)指的是兩個(gè)或兩個(gè)以上的運(yùn)算單元(進(jìn)程、線(xiàn)程或協(xié)程),都在等待對(duì)方停止執(zhí)行,以取得系統(tǒng)資源,但是沒(méi)有一方提前退出,就稱(chēng)為死鎖。
死鎖示例
接下來(lái),我們先來(lái)演示一下 Java 中最簡(jiǎn)單的死鎖,我們創(chuàng)建兩個(gè)鎖和兩個(gè)線(xiàn)程,讓線(xiàn)程 1 先擁有鎖 A,然后在 1s 后嘗試獲取鎖 B,同時(shí)我們啟動(dòng)線(xiàn)程 2,讓它先擁有鎖 B,然后在 1s 之后嘗試獲取鎖 A,這時(shí)就會(huì)出現(xiàn)相互等待對(duì)方釋放鎖的情況,從而造成死鎖的問(wèn)題,具體代碼如下:
publicclass DeadLockExample {
public static void main(String[] args) {
Object lockA = new Object(); // 創(chuàng)建鎖 A
Object lockB = new Object(); // 創(chuàng)建鎖 B
// 創(chuàng)建線(xiàn)程 1
Thread t1 = new Thread(new Runnable() {
@Override
public void run() {
// 先獲取鎖 A
synchronized (lockA) {
System.out.println("線(xiàn)程 1:獲取到鎖 A!");
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
// 嘗試獲取鎖 B
System.out.println("線(xiàn)程 1:等待獲取 B...");
synchronized (lockB) {
System.out.println("線(xiàn)程 1:獲取到鎖 B!");
}
}
}
});
t1.start(); // 運(yùn)行線(xiàn)程
// 創(chuàng)建線(xiàn)程 2
Thread t2 = new Thread(new Runnable() {
@Override
public void run() {
// 先獲取鎖 B
synchronized (lockB) {
System.out.println("線(xiàn)程 2:獲取到鎖 B!");
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
// 嘗試獲取鎖 A
System.out.println("線(xiàn)程 2:等待獲取 A...");
synchronized (lockA) {
System.out.println("線(xiàn)程 2:獲取到鎖 A!");
}
}
}
});
t2.start(); // 運(yùn)行線(xiàn)程
}
}
以上程序的執(zhí)行結(jié)果如下:
從上述結(jié)果可以看出,線(xiàn)程 1 和線(xiàn)程 2 都在等待對(duì)方釋放鎖,這樣就造成了死鎖問(wèn)題。
死鎖產(chǎn)生原因
通過(guò)以上示例,我們可以得出結(jié)論,要產(chǎn)生死鎖需要滿(mǎn)足以下 4 個(gè)條件:
- 互斥條件:指運(yùn)算單元(進(jìn)程、線(xiàn)程或協(xié)程)對(duì)所分配到的資源具有排它性,也就是說(shuō)在一段時(shí)間內(nèi)某個(gè)鎖資源只能被一個(gè)運(yùn)算單元所占用。
- 請(qǐng)求和保持條件:指運(yùn)算單元已經(jīng)保持至少一個(gè)資源,但又提出了新的資源請(qǐng)求,而該資源已被其它運(yùn)算單元占有,此時(shí)請(qǐng)求運(yùn)算單元阻塞,但又對(duì)自己已獲得的其它資源保持不放。
- 不可剝奪條件:指運(yùn)算單元已獲得的資源,在未使用完之前,不能被剝奪。
- 環(huán)路等待條件:指在發(fā)生死鎖時(shí),必然存在運(yùn)算單元和資源的環(huán)形鏈,即運(yùn)算單元正在等待另一個(gè)運(yùn)算單元占用的資源,而對(duì)方又在等待自己占用的資源,從而造成環(huán)路等待的情況。
只有以上 4 個(gè)條件同時(shí)滿(mǎn)足,才會(huì)造成死鎖問(wèn)題。
死鎖排查
如果程序出現(xiàn)死鎖問(wèn)題,可通過(guò)以下 4 種方案中的任意一種進(jìn)行分析和排查。
方案 1:jstack
我們?cè)谑褂?jstack 之前,先要通過(guò) jps 得到運(yùn)行程序的進(jìn)程 ID,使用方法如下:
“jps -l”可以查詢(xún)本機(jī)所有的 Java 程序,jps(Java Virtual Machine Process Status Tool)是 Java 提供的一個(gè)顯示當(dāng)前所有 Java 進(jìn)程 pid 的命令,適合在 linux/unix/windows 平臺(tái)上簡(jiǎn)單察看當(dāng)前 Java 進(jìn)程的一些簡(jiǎn)單情況,“-l”用于輸出進(jìn)程 pid 和運(yùn)行程序完整路徑名(包名和類(lèi)名)。
有了進(jìn)程 ID(PID)之后,我們就可以使用“jstack -l PID”來(lái)發(fā)現(xiàn)死鎖問(wèn)題了,如下圖所示:
jstack 用于生成 Java 虛擬機(jī)當(dāng)前時(shí)刻的線(xiàn)程快照,“-l”表示長(zhǎng)列表(long),打印關(guān)于鎖的附加信息。
PS:可以使用 jstack -help 查看更多命令使用說(shuō)明。
方案 2:jconsole
使用 jconsole 需要打開(kāi) JDK 的 bin 目錄,找到 jconsole 并雙擊打開(kāi),如下圖所示:
然后選擇要調(diào)試的程序,如下圖所示:
之后點(diǎn)擊連接進(jìn)入,選擇“不安全的連接”進(jìn)入監(jiān)控主頁(yè),如下圖所示:
之后切換到“線(xiàn)程”模塊,點(diǎn)擊“檢測(cè)死鎖”按鈕,如下圖所示:
之后稍等片刻就會(huì)檢測(cè)出死鎖的相關(guān)信息,如下圖所示:
方案 3:jvisualvm
jvisualvm 也在 JDK 的 bin 目錄中,同樣是雙擊打開(kāi):
稍等幾秒之后,jvisualvm 中就會(huì)出現(xiàn)本地的所有 Java 程序,如下圖所示:
雙擊選擇要調(diào)試的程序:
單機(jī)鼠標(biāo)進(jìn)入“線(xiàn)程”模塊,如下圖所示:
從上圖可以看出,當(dāng)我們切換到線(xiàn)程一欄之后就會(huì)直接顯示出死鎖信息,之后點(diǎn)擊“線(xiàn)程 Dump”生成死鎖的詳情信息,如下圖所示:
方案 4:jmc
jmc 是 Oracle Java Mission Control 的縮寫(xiě),是一個(gè)對(duì) Java 程序進(jìn)行管理、監(jiān)控、概要分析和故障排查的工具套件。它也是在 JDK 的 bin 目錄中,同樣是雙擊啟動(dòng),如下圖所示:
jmc 主頁(yè)信息如下:
之后選中要排查的程序,右鍵“啟動(dòng) JMX 控制臺(tái)”查看此程序的詳細(xì)內(nèi)容,如下圖所示:
然后點(diǎn)擊“線(xiàn)程”,勾中“死鎖檢測(cè)”就可以發(fā)現(xiàn)死鎖和死鎖的詳情信息,如下圖所示:
如何解決死鎖?
解決的思路是打破導(dǎo)致導(dǎo)致死鎖因素中的:
- 請(qǐng)求和保持條件(輪詢(xún)鎖):所謂的順序鎖指的是通過(guò)有順序的獲取鎖,所有線(xiàn)程設(shè)置相同獲取鎖的順序,從而避免產(chǎn)生環(huán)路等待條件,從而解決死鎖問(wèn)題的。
- 環(huán)路等待條件(順序鎖):輪詢(xún)鎖是通過(guò)打破“請(qǐng)求和保持條件”來(lái)避免造成死鎖的,它的實(shí)現(xiàn)思路簡(jiǎn)單來(lái)說(shuō)就是通過(guò)輪詢(xún)來(lái)嘗試獲取鎖,如果有一個(gè)鎖獲取失敗,則釋放當(dāng)前線(xiàn)程擁有的所有鎖,等待下一輪再?lài)L試獲取鎖,輪詢(xún)鎖可以通過(guò) ReentrantLock 的 tryLock 方法來(lái)實(shí)現(xiàn)。