
前言
在 Java 的并發(fā)編程中,有一個(gè)問題需要特別注意,那就是死鎖,如果發(fā)生了死鎖,基本就是重啟,而重啟將會丟失運(yùn)行中的數(shù)據(jù)。所以,了解死鎖的形成并排查死鎖到預(yù)防死鎖成了一個(gè)重要的問題。
我們了解任何一個(gè)事情的步驟是:what,how,why,why not。
1. 什么是死鎖?
我們還是直接寫一段代碼來看看:
package hello;
public class DeadLock {
public static void main(String[] args) {
new Thread(() -> {
try {
new DeadLock().resource1();
} catch (InterruptedException e) {
}
}
).start();
new Thread(() -> {
try {
new DeadLock().resource2();
} catch (InterruptedException e) {
}
}
).start();
}
void resource1() throws InterruptedException {
synchronized ("resource1") {
System.out.println("獲取資源1");
// 等待 1 秒讓另一個(gè)線程拿到鎖
Thread.sleep(1000);
resource2();
}
}
void resource2() throws InterruptedException {
synchronized ("resource2") {
System.out.println("獲取資源2");
// 等待 1 秒讓另一個(gè)線程拿到鎖
Thread.sleep(1000);
resource1();
}
}
}
上面的代碼中,我們啟用了兩個(gè)線程,分別搶占2個(gè)資源,但這兩個(gè)資源又分別被不同的對象(字符串)鎖住了。當(dāng)?shù)谝粋€(gè)線程調(diào)用 resource1 方法,進(jìn)入同步塊,拿到鎖,并等待 1 秒鐘讓另一個(gè)線程進(jìn)入 resource2 同步塊,當(dāng)?shù)诙€(gè)線程進(jìn)入同步塊后,注意:此時(shí), 拿著 resourec1 鎖的線程企圖拿到 resource2 的鎖,但這個(gè)時(shí)候,拿著 resource2 的線程也想去拿 resource1 的鎖。于是就出現(xiàn)了互相僵持的情況,誰也無法拿到對方的鎖,整個(gè)系統(tǒng)就卡死了。
這種情況就是死鎖。
像我們現(xiàn)在寫的代碼是自己故意造出來的死鎖,我們能夠發(fā)現(xiàn),那如果是線上環(huán)境怎么辦,假如我們的系統(tǒng)卡死了,我們怎么知道到底是哪一段代碼出現(xiàn)了問題,有沒有可能使死鎖的問題。也就是如何檢測死鎖。
2. 如何檢測死鎖?
由于死鎖極難通過人工的方式查出來,因此JDK 提供了命令來檢測某個(gè)java進(jìn)程中心線程的情況,并排查有沒有死鎖。上面命令呢? jps , 用來查看java 程序的進(jìn)程號,當(dāng)然在 Linux 中也可以通過別的方式獲取, jstack 進(jìn)程號命令則可以答應(yīng)對應(yīng)進(jìn)程的棧信息,并找到死鎖。
我們就剛剛的程序,在 windows 上使用該命令。
C:\Users\stateis0>jps
11060
2084 Launcher
10712 RemoteMavenServer
18040 Jps
11820 DeadLock
C:\Users\stateis0>jstack 11820
2017-12-29 18:52:38
Full thread dump Java HotSpot(TM) Client VM (25.131-b11 mixed mode):
"DestroyJavaVM" #11 prio=5 os_prio=0 tid=0x051fe800 nid=0x1e0c waiting on condition [0x00000000]
java.lang.Thread.State: RUNNABLE
"Thread-1" #10 prio=5 os_prio=0 tid=0x18777800 nid=0x5664 waiting for monitor entry [0x18e0f000]
java.lang.Thread.State: BLOCKED (on object monitor)
at hello.DeadLock.resource1(DeadLock.java:31)
- waiting to lock <0x07415a50> (a java.lang.String)
at hello.DeadLock.resource2(DeadLock.java:43)
- locked <0x0742bd18> (a java.lang.String)
at hello.DeadLock.lambda$main$1(DeadLock.java:20)
at hello.DeadLock$$Lambda$2/4983748.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
"Thread-0" #9 prio=5 os_prio=0 tid=0x18776c00 nid=0x4dc4 waiting for monitor entry [0x18d7f000]
java.lang.Thread.State: BLOCKED (on object monitor)
at hello.DeadLock.resource2(DeadLock.java:41)
- waiting to lock <0x0742bd18> (a java.lang.String)
at hello.DeadLock.resource1(DeadLock.java:33)
- locked <0x07415a50> (a java.lang.String)
at hello.DeadLock.lambda$main$0(DeadLock.java:11)
at hello.DeadLock$$Lambda$1/5592464.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
"Service Thread" #8 daemon prio=9 os_prio=0 tid=0x186e4c00 nid=0x172c runnable [0x00000000]
java.lang.Thread.State: RUNNABLE
"C1 CompilerThread0" #7 daemon prio=9 os_prio=2 tid=0x186af000 nid=0x53f8 waiting on condition [0x00000000]
java.lang.Thread.State: RUNNABLE
"Monitor Ctrl-Break" #6 daemon prio=5 os_prio=0 tid=0x1861e800 nid=0x3928 runnable [0x18b3f000]
java.lang.Thread.State: RUNNABLE
at java.net.SocketInputStream.socketRead0(Native Method)
at java.net.SocketInputStream.socketRead(SocketInputStream.java:116)
at java.net.SocketInputStream.read(SocketInputStream.java:171)
at java.net.SocketInputStream.read(SocketInputStream.java:141)
at sun.nio.cs.StreamDecoder.readBytes(StreamDecoder.java:284)
at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:326)
at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:178)
- locked <0x07861da0> (a java.io.InputStreamReader)
at java.io.InputStreamReader.read(InputStreamReader.java:184)
at java.io.BufferedReader.fill(BufferedReader.java:161)
at java.io.BufferedReader.readLine(BufferedReader.java:324)
- locked <0x07861da0> (a java.io.InputStreamReader)
at java.io.BufferedReader.readLine(BufferedReader.java:389)
at com.intellij.rt.execution.application.AppMainV2$1.run(AppMainV2.java:64)
"Attach Listener" #5 daemon prio=5 os_prio=2 tid=0x179c0800 nid=0x40a0 waiting on condition [0x00000000]
java.lang.Thread.State: RUNNABLE
"Signal Dispatcher" #4 daemon prio=9 os_prio=2 tid=0x17985c00 nid=0x5004 runnable [0x00000000]
java.lang.Thread.State: RUNNABLE
"Finalizer" #3 daemon prio=8 os_prio=1 tid=0x17972400 nid=0x41a8 in Object.wait() [0x17cff000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x0ca1b830> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:143)
- locked <0x0ca1b830> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:164)
at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:209)
"Reference Handler" #2 daemon prio=10 os_prio=2 tid=0x17960000 nid=0x4ef0 in Object.wait() [0x17c6f000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x0ca1b9d0> (a java.lang.ref.Reference$Lock)
at java.lang.Object.wait(Object.java:502)
at java.lang.ref.Reference.tryHandlePending(Reference.java:191)
- locked <0x0ca1b9d0> (a java.lang.ref.Reference$Lock)
at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:153)
"VM Thread" os_prio=2 tid=0x1795a800 nid=0x3f54 runnable
"VM Periodic Task Thread" os_prio=2 tid=0x18739400 nid=0x4a14 waiting on condition
JNI global references: 229
// 找到一個(gè)死鎖
Found one Java-level deadlock:
=============================
"Thread-1":
waiting to lock monitor 0x17978de4 (object 0x07415a50, a java.lang.String),
which is held by "Thread-0"
"Thread-0":
waiting to lock monitor 0x1797a974 (object 0x0742bd18, a java.lang.String),
which is held by "Thread-1"
Java stack information for the threads listed above:
===================================================
"Thread-1":
at hello.DeadLock.resource1(DeadLock.java:31)
// 等待 0x07415a50 鎖
- waiting to lock <0x07415a50> (a java.lang.String)
at hello.DeadLock.resource2(DeadLock.java:43)
// 持有 0x0742bd18
- locked <0x0742bd18> (a java.lang.String)
at hello.DeadLock.lambda$main$1(DeadLock.java:20)
at hello.DeadLock$$Lambda$2/4983748.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
"Thread-0":
at hello.DeadLock.resource2(DeadLock.java:41)
// 等待 0x0742bd18 鎖
- waiting to lock <0x0742bd18> (a java.lang.String)
at hello.DeadLock.resource1(DeadLock.java:33)
// 持有 0x07415a50
- locked <0x07415a50> (a java.lang.String)
at hello.DeadLock.lambda$main$0(DeadLock.java:11)
at hello.DeadLock$$Lambda$1/5592464.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
// 發(fā)現(xiàn)了一個(gè)死鎖
Found 1 deadlock.
C:\Users\stateis0>
Thread-1 waiting to lock <0x07415a50> locked <0x0742bd18>
Thread-0 waiting to lock <0x0742bd18> locked <0x07415a50>
我們首先使用 jps 命令找到 java 進(jìn)程號,然后使用 jstack 進(jìn)程號 打印進(jìn)程棧的信息,其中,在最后的部分,jstack 告訴我們,他找到了一個(gè)死鎖,其中又詳細(xì)的信息:Thread-1 線程(這里我們沒有給線程其合適的名字,如果在線上,給線程起一個(gè)合適的名字將更有利于排查)持有 String 類型的編號為 0x07415a50 的鎖,等待編號為 0x07415a50 的鎖 , 但這個(gè)鎖由 Thread-0 持有,于此同時(shí),Thread-0 和 Thread-1 相反。Thread-0 線程持有 0x07415a50 的鎖,等待 0x07415a50 的鎖。我們的注釋里也寫上了。
那么發(fā)生了死鎖,該怎么辦呢?最簡單的辦法就是重啟,重啟之后,對 jstack 中打印的堆棧信息中的代碼進(jìn)行修改。重新發(fā)布。當(dāng)然還有一些高級策略,比如讓進(jìn)程回滾到死鎖前的狀態(tài),然后讓他們順序進(jìn)入同步塊。
3. 死鎖有哪些形成的原因
一般來說,要出現(xiàn)死鎖問題需要滿足以下條件:
互斥條件:一個(gè)資源每次只能被一個(gè)線程使用。
請求與保持條件:一個(gè)進(jìn)程因請求資源而阻塞時(shí),對已獲得的資源保持不放。
不剝奪條件:進(jìn)程已獲得的資源,在未使用完之前,不能強(qiáng)行剝奪。
循環(huán)等待條件:若干進(jìn)程之間形成一種頭尾相接的循環(huán)等待資源關(guān)系。
死鎖是由四個(gè)必要條件導(dǎo)致的,所以一般來說,只要破壞這四個(gè)必要條件中的一個(gè)條件,死鎖情況就應(yīng)該不會發(fā)生。
如果想要打破互斥條件,我們需要允許進(jìn)程同時(shí)訪問某些資源,這種方法受制于實(shí)際場景,不太容易實(shí)現(xiàn)條件;
打破不可搶占條件,這樣需要允許進(jìn)程強(qiáng)行從占有者那里奪取某些資源,或者簡單一點(diǎn)理解,占有資源的進(jìn)程不能再申請占有其他資源,必須釋放手上的資源之后才能發(fā)起申請,這個(gè)其實(shí)也很難找到適用場景;
進(jìn)程在運(yùn)行前申請得到所有的資源,否則該進(jìn)程不能進(jìn)入準(zhǔn)備執(zhí)行狀態(tài)。這個(gè)方法看似有點(diǎn)用處,但是它的缺點(diǎn)是可能導(dǎo)致資源利用率和進(jìn)程并發(fā)性降低;
避免出現(xiàn)資源申請環(huán)路,即對資源事先分類編號,按號分配。這種方式可以有效提高資源的利用率和系統(tǒng)吞吐量,但是增加了系統(tǒng)開銷,增大了進(jìn)程對資源的占用時(shí)間。
4 總結(jié)
并發(fā)編程中的坑很多,尤其死鎖,造成的問題基本只能靠重啟來解決,如果遇到了數(shù)據(jù)保存在內(nèi)存中但沒有持久化的話,那么重啟將出現(xiàn)很大的問題。因此我們在用鎖的時(shí)候,一定要小心。避免出現(xiàn)死鎖,如果出現(xiàn)了死鎖,則可以使用 jstack 命令查看線程是否有死鎖。用以排查問題。
總之并發(fā)的坑很多,樓主以后將會多多分析。
good luck !?。?!