死鎖的產(chǎn)生以及如何避免死鎖

一、死鎖的定義

多線程以及多進(jìn)程改善了系統(tǒng)資源的利用率并提高了系統(tǒng) 的處理能力。然而,并發(fā)執(zhí)行也帶來了新的問題——死鎖。所謂死鎖是指多個(gè)線程因競(jìng)爭(zhēng)資源而造成的一種僵局(互相等待),若無外力作用,這些進(jìn)程都將無法向前推進(jìn)。

下面我們通過一些實(shí)例來說明死鎖現(xiàn)象。

先看生活中的一個(gè)實(shí)例,2個(gè)人一起吃飯但是只有一雙筷子,2人輪流吃(同時(shí)擁有2只筷子才能吃)。某一個(gè)時(shí)候,一個(gè)拿了左筷子,一人拿了右筷子,2個(gè)人都同時(shí)占用一個(gè)資源,等待另一個(gè)資源,這個(gè)時(shí)候甲在等待乙吃完并釋放它占有的筷子,同理,乙也在等待甲吃完并釋放它占有的筷子,這樣就陷入了一個(gè)死循環(huán),誰也無法繼續(xù)吃飯。。。

在計(jì)算機(jī)系統(tǒng)中也存在類似的情況。例如,某計(jì)算機(jī)系統(tǒng)中只有一臺(tái)打印機(jī)和一臺(tái)輸入 設(shè)備,進(jìn)程P1正占用輸入設(shè)備,同時(shí)又提出使用打印機(jī)的請(qǐng)求,但此時(shí)打印機(jī)正被進(jìn)程P2 所占用,而P2在未釋放打印機(jī)之前,又提出請(qǐng)求使用正被P1占用著的輸入設(shè)備。這樣兩個(gè)進(jìn)程相互無休止地等待下去,均無法繼續(xù)執(zhí)行,此時(shí)兩個(gè)進(jìn)程陷入死鎖狀態(tài)。

二、死鎖產(chǎn)生的原因

1) 系統(tǒng)資源的競(jìng)爭(zhēng)

通常系統(tǒng)中擁有的不可剝奪資源,其數(shù)量不足以滿足多個(gè)進(jìn)程運(yùn)行的需要,使得進(jìn)程在 運(yùn)行過程中,會(huì)因爭(zhēng)奪資源而陷入僵局,如磁帶機(jī)、打印機(jī)等。只有對(duì)不可剝奪資源的競(jìng)爭(zhēng) 才可能產(chǎn)生死鎖,對(duì)可剝奪資源的競(jìng)爭(zhēng)是不會(huì)引起死鎖的。

2) 進(jìn)程推進(jìn)順序非法

進(jìn)程在運(yùn)行過程中,請(qǐng)求和釋放資源的順序不當(dāng),也同樣會(huì)導(dǎo)致死鎖。例如,并發(fā)進(jìn)程 P1、P2分別保持了資源R1、R2,而進(jìn)程P1申請(qǐng)資源R2,進(jìn)程P2申請(qǐng)資源R1時(shí),兩者都 會(huì)因?yàn)樗栀Y源被占用而阻塞。

信號(hào)量使用不當(dāng)也會(huì)造成死鎖。進(jìn)程間彼此相互等待對(duì)方發(fā)來的消息,結(jié)果也會(huì)使得這 些進(jìn)程間無法繼續(xù)向前推進(jìn)。例如,進(jìn)程A等待進(jìn)程B發(fā)的消息,進(jìn)程B又在等待進(jìn)程A 發(fā)的消息,可以看出進(jìn)程A和B不是因?yàn)楦?jìng)爭(zhēng)同一資源,而是在等待對(duì)方的資源導(dǎo)致死鎖。

3) 死鎖產(chǎn)生的必要條件

產(chǎn)生死鎖必須同時(shí)滿足以下四個(gè)條件,只要其中任一條件不成立,死鎖就不會(huì)發(fā)生。

互斥條件:進(jìn)程要求對(duì)所分配的資源(如打印機(jī))進(jìn)行排他性控制,即在一段時(shí)間內(nèi)某 資源僅為一個(gè)進(jìn)程所占有。此時(shí)若有其他進(jìn)程請(qǐng)求該資源,則請(qǐng)求進(jìn)程只能等待。

不剝奪條件:進(jìn)程所獲得的資源在未使用完畢之前,不能被其他進(jìn)程強(qiáng)行奪走,即只能 由獲得該資源的進(jìn)程自己來釋放(只能是主動(dòng)釋放)。

請(qǐng)求和保持條件:進(jìn)程已經(jīng)保持了至少一個(gè)資源,但又提出了新的資源請(qǐng)求,而該資源 已被其他進(jìn)程占有,此時(shí)請(qǐng)求進(jìn)程被阻塞,但對(duì)自己已獲得的資源保持不放。

循環(huán)等待條件:存在一種進(jìn)程資源的循環(huán)等待鏈,鏈中每一個(gè)進(jìn)程已獲得的資源同時(shí)被 鏈中下一個(gè)進(jìn)程所請(qǐng)求。即存在一個(gè)處于等待狀態(tài)的進(jìn)程集合{Pl, P2, ..., pn},其中Pi等 待的資源被P(i+1)占有(i=0, 1, ..., n-1),Pn等待的資源被P0占有,如圖2-15所示。

直觀上看,循環(huán)等待條件似乎和死鎖的定義一樣,其實(shí)不然。按死鎖定義構(gòu)成等待環(huán)所 要求的條件更嚴(yán),它要求Pi等待的資源必須由P(i+1)來滿足,而循環(huán)等待條件則無此限制。 例如,系統(tǒng)中有兩臺(tái)輸出設(shè)備,P0占有一臺(tái),PK占有另一臺(tái),且K不屬于集合{0, 1, ..., n}。

Pn等待一臺(tái)輸出設(shè)備,它可以從P0獲得,也可能從PK獲得。因此,雖然Pn、P0和其他 一些進(jìn)程形成了循環(huán)等待圈,但PK不在圈內(nèi),若PK釋放了輸出設(shè)備,則可打破循環(huán)等待, 如圖2-16所示。因此循環(huán)等待只是死鎖的必要條件。

資源分配圖含圈而系統(tǒng)又不一定有死鎖的原因是同類資源數(shù)大于1。但若系統(tǒng)中每類資 源都只有一個(gè)資源,則資源分配圖含圈就變成了系統(tǒng)出現(xiàn)死鎖的充分必要條件。

產(chǎn)生死鎖的一個(gè)例子

/**

* 一個(gè)簡(jiǎn)單的死鎖類

* 當(dāng)DeadLock類的對(duì)象flag==1時(shí)(td1),先鎖定o1,睡眠500毫秒

* 而td1在睡眠的時(shí)候另一個(gè)flag==0的對(duì)象(td2)線程啟動(dòng),先鎖定o2,睡眠500毫秒

* td1睡眠結(jié)束后需要鎖定o2才能繼續(xù)執(zhí)行,而此時(shí)o2已被td2鎖定;

* td2睡眠結(jié)束后需要鎖定o1才能繼續(xù)執(zhí)行,而此時(shí)o1已被td1鎖定;

* td1、td2相互等待,都需要得到對(duì)方鎖定的資源才能繼續(xù)執(zhí)行,從而死鎖。

*/?

public class DeadLock implements Runnable {?

? ? public int flag = 1;?

? ? //靜態(tài)對(duì)象是類的所有對(duì)象共享的?

? ? private static Object o1 = new Object(), o2 = new Object();?

? ? @Override?

? ? public void run() {?

? ? ? ? System.out.println("flag=" + flag);?

? ? ? ? if (flag == 1) {?

? ? ? ? ? ? synchronized (o1) {?

? ? ? ? ? ? ? ? try {?

? ? ? ? ? ? ? ? ? ? Thread.sleep(500);?

? ? ? ? ? ? ? ? } catch (Exception e) {?

? ? ? ? ? ? ? ? ? ? e.printStackTrace();?

? ? ? ? ? ? ? ? }?

? ? ? ? ? ? ? ? synchronized (o2) {?

? ? ? ? ? ? ? ? ? ? System.out.println("1");?

? ? ? ? ? ? ? ? }?

? ? ? ? ? ? }?

? ? ? ? }?

? ? ? ? if (flag == 0) {?

? ? ? ? ? ? synchronized (o2) {?

? ? ? ? ? ? ? ? try {?

? ? ? ? ? ? ? ? ? ? Thread.sleep(500);?

? ? ? ? ? ? ? ? } catch (Exception e) {?

? ? ? ? ? ? ? ? ? ? e.printStackTrace();?

? ? ? ? ? ? ? ? }?

? ? ? ? ? ? ? ? synchronized (o1) {?

? ? ? ? ? ? ? ? ? ? System.out.println("0");?

? ? ? ? ? ? ? ? }?

? ? ? ? ? ? }?

? ? ? ? }?

? ? }?

? ? public static void main(String[] args) {?

? ? ? ? DeadLock td1 = new DeadLock();?

? ? ? ? DeadLock td2 = new DeadLock();?

? ? ? ? td1.flag = 1;?

? ? ? ? td2.flag = 0;?

? ? ? ? //td1,td2都處于可執(zhí)行狀態(tài),但JVM線程調(diào)度先執(zhí)行哪個(gè)線程是不確定的。?

? ? ? ? //td2的run()可能在td1的run()之前運(yùn)行?

? ? ? ? new Thread(td1).start();?

? ? ? ? new Thread(td2).start();?

? ? }?

}?

三、如何避免死鎖

在有些情況下死鎖是可以避免的。三種用于避免死鎖的技術(shù):

加鎖順序(線程按照一定的順序加鎖)

加鎖時(shí)限(線程嘗試獲取鎖的時(shí)候加上一定的時(shí)限,超過時(shí)限則放棄對(duì)該鎖的請(qǐng)求,并釋放自己占有的鎖)

死鎖檢測(cè)

加鎖順序

當(dāng)多個(gè)線程需要相同的一些鎖,但是按照不同的順序加鎖,死鎖就很容易發(fā)生。

如果能確保所有的線程都是按照相同的順序獲得鎖,那么死鎖就不會(huì)發(fā)生??聪旅孢@個(gè)例子:

Thread 1:

? lock A

? lock B

Thread 2:

? wait for A

? lock C (when A locked)

Thread 3:

? wait for A

? wait for B

? wait for C

如果一個(gè)線程(比如線程3)需要一些鎖,那么它必須按照確定的順序獲取鎖。它只有獲得了從順序上排在前面的鎖之后,才能獲取后面的鎖。

例如,線程2和線程3只有在獲取了鎖A之后才能嘗試獲取鎖C(譯者注:獲取鎖A是獲取鎖C的必要條件)。因?yàn)榫€程1已經(jīng)擁有了鎖A,所以線程2和3需要一直等到鎖A被釋放。然后在它們嘗試對(duì)B或C加鎖之前,必須成功地對(duì)A加了鎖。

按照順序加鎖是一種有效的死鎖預(yù)防機(jī)制。但是,這種方式需要你事先知道所有可能會(huì)用到的鎖(譯者注:并對(duì)這些鎖做適當(dāng)?shù)呐判?,但總有些時(shí)候是無法預(yù)知的。

加鎖時(shí)限

另外一個(gè)可以避免死鎖的方法是在嘗試獲取鎖的時(shí)候加一個(gè)超時(shí)時(shí)間,這也就意味著在嘗試獲取鎖的過程中若超過了這個(gè)時(shí)限該線程則放棄對(duì)該鎖請(qǐng)求。若一個(gè)線程沒有在給定的時(shí)限內(nèi)成功獲得所有需要的鎖,則會(huì)進(jìn)行回退并釋放所有已經(jīng)獲得的鎖,然后等待一段隨機(jī)的時(shí)間再重試。這段隨機(jī)的等待時(shí)間讓其它線程有機(jī)會(huì)嘗試獲取相同的這些鎖,并且讓該應(yīng)用在沒有獲得鎖的時(shí)候可以繼續(xù)運(yùn)行(譯者注:加鎖超時(shí)后可以先繼續(xù)運(yùn)行干點(diǎn)其它事情,再回頭來重復(fù)之前加鎖的邏輯)。

以下是一個(gè)例子,展示了兩個(gè)線程以不同的順序嘗試獲取相同的兩個(gè)鎖,在發(fā)生超時(shí)后回退并重試的場(chǎng)景:

Thread 1 locks A

Thread 2 locks B

Thread 1 attempts to lock B but is blocked

Thread 2 attempts to lock A but is blocked

Thread 1's lock attempt on B times out

Thread 1 backs up and releases A as well

Thread 1 waits randomly (e.g. 257 millis) before retrying.

Thread 2's lock attempt on A times out

Thread 2 backs up and releases B as well

Thread 2 waits randomly (e.g. 43 millis) before retrying.

在上面的例子中,線程2比線程1早200毫秒進(jìn)行重試加鎖,因此它可以先成功地獲取到兩個(gè)鎖。這時(shí),線程1嘗試獲取鎖A并且處于等待狀態(tài)。當(dāng)線程2結(jié)束時(shí),線程1也可以順利的獲得這兩個(gè)鎖(除非線程2或者其它線程在線程1成功獲得兩個(gè)鎖之前又獲得其中的一些鎖)。

需要注意的是,由于存在鎖的超時(shí),所以我們不能認(rèn)為這種場(chǎng)景就一定是出現(xiàn)了死鎖。也可能是因?yàn)楂@得了鎖的線程(導(dǎo)致其它線程超時(shí))需要很長(zhǎng)的時(shí)間去完成它的任務(wù)。

此外,如果有非常多的線程同一時(shí)間去競(jìng)爭(zhēng)同一批資源,就算有超時(shí)和回退機(jī)制,還是可能會(huì)導(dǎo)致這些線程重復(fù)地嘗試但卻始終得不到鎖。如果只有兩個(gè)線程,并且重試的超時(shí)時(shí)間設(shè)定為0到500毫秒之間,這種現(xiàn)象可能不會(huì)發(fā)生,但是如果是10個(gè)或20個(gè)線程情況就不同了。因?yàn)檫@些線程等待相等的重試時(shí)間的概率就高的多(或者非常接近以至于會(huì)出現(xiàn)問題)。

(譯者注:超時(shí)和重試機(jī)制是為了避免在同一時(shí)間出現(xiàn)的競(jìng)爭(zhēng),但是當(dāng)線程很多時(shí),其中兩個(gè)或多個(gè)線程的超時(shí)時(shí)間一樣或者接近的可能性就會(huì)很大,因此就算出現(xiàn)競(jìng)爭(zhēng)而導(dǎo)致超時(shí)后,由于超時(shí)時(shí)間一樣,它們又會(huì)同時(shí)開始重試,導(dǎo)致新一輪的競(jìng)爭(zhēng),帶來了新的問題。)

這種機(jī)制存在一個(gè)問題,在Java中不能對(duì)synchronized同步塊設(shè)置超時(shí)時(shí)間。你需要?jiǎng)?chuàng)建一個(gè)自定義鎖,或使用Java5中java.util.concurrent包下的工具。寫一個(gè)自定義鎖類不復(fù)雜,但超出了本文的內(nèi)容。后續(xù)的Java并發(fā)系列會(huì)涵蓋自定義鎖的內(nèi)容。

死鎖檢測(cè)

死鎖檢測(cè)是一個(gè)更好的死鎖預(yù)防機(jī)制,它主要是針對(duì)那些不可能實(shí)現(xiàn)按序加鎖并且鎖超時(shí)也不可行的場(chǎng)景。

每當(dāng)一個(gè)線程獲得了鎖,會(huì)在線程和鎖相關(guān)的數(shù)據(jù)結(jié)構(gòu)中(map、graph等等)將其記下。除此之外,每當(dāng)有線程請(qǐng)求鎖,也需要記錄在這個(gè)數(shù)據(jù)結(jié)構(gòu)中。

當(dāng)一個(gè)線程請(qǐng)求鎖失敗時(shí),這個(gè)線程可以遍歷鎖的關(guān)系圖看看是否有死鎖發(fā)生。例如,線程A請(qǐng)求鎖7,但是鎖7這個(gè)時(shí)候被線程B持有,這時(shí)線程A就可以檢查一下線程B是否已經(jīng)請(qǐng)求了線程A當(dāng)前所持有的鎖。如果線程B確實(shí)有這樣的請(qǐng)求,那么就是發(fā)生了死鎖(線程A擁有鎖1,請(qǐng)求鎖7;線程B擁有鎖7,請(qǐng)求鎖1)。

當(dāng)然,死鎖一般要比兩個(gè)線程互相持有對(duì)方的鎖這種情況要復(fù)雜的多。線程A等待線程B,線程B等待線程C,線程C等待線程D,線程D又在等待線程A。線程A為了檢測(cè)死鎖,它需要遞進(jìn)地檢測(cè)所有被B請(qǐng)求的鎖。從線程B所請(qǐng)求的鎖開始,線程A找到了線程C,然后又找到了線程D,發(fā)現(xiàn)線程D請(qǐng)求的鎖被線程A自己持有著。這是它就知道發(fā)生了死鎖。

下面是一幅關(guān)于四個(gè)線程(A,B,C和D)之間鎖占有和請(qǐng)求的關(guān)系圖。像這樣的數(shù)據(jù)結(jié)構(gòu)就可以被用來檢測(cè)死鎖。

那么當(dāng)檢測(cè)出死鎖時(shí),這些線程該做些什么呢?

一個(gè)可行的做法是釋放所有鎖,回退,并且等待一段隨機(jī)的時(shí)間后重試。這個(gè)和簡(jiǎn)單的加鎖超時(shí)類似,不一樣的是只有死鎖已經(jīng)發(fā)生了才回退,而不會(huì)是因?yàn)榧渔i的請(qǐng)求超時(shí)了。雖然有回退和等待,但是如果有大量的線程競(jìng)爭(zhēng)同一批鎖,它們還是會(huì)重復(fù)地死鎖(編者注:原因同超時(shí)類似,不能從根本上減輕競(jìng)爭(zhēng))。

一個(gè)更好的方案是給這些線程設(shè)置優(yōu)先級(jí),讓一個(gè)(或幾個(gè))線程回退,剩下的線程就像沒發(fā)生死鎖一樣繼續(xù)保持著它們需要的鎖。如果賦予這些線程的優(yōu)先級(jí)是固定不變的,同一批線程總是會(huì)擁有更高的優(yōu)先級(jí)。為避免這個(gè)問題,可以在死鎖發(fā)生的時(shí)候設(shè)置隨機(jī)的優(yōu)先級(jí)。

摘抄,感謝作者!如有侵權(quán)請(qǐng)聯(lián)系本人刪除!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 1、競(jìng)態(tài)條件: 定義:競(jìng)態(tài)條件指的是一種特殊的情況,在這種情況下各個(gè)執(zhí)行單元以一種沒有邏輯的順序執(zhí)行動(dòng)作,從而導(dǎo)致...
    Hughman閱讀 1,442評(píng)論 0 7
  • 轉(zhuǎn)載自 https://blog.csdn.net/ls5718/article/details/51896159...
    慕童閱讀 694評(píng)論 0 0
  • 線程 操作系統(tǒng)線程理論 線程概念的引入背景 進(jìn)程 之前我們已經(jīng)了解了操作系統(tǒng)中進(jìn)程的概念,程序并不能單獨(dú)運(yùn)行,只有...
    go以恒閱讀 1,806評(píng)論 0 6
  • 本文出自 Eddy Wiki ,轉(zhuǎn)載請(qǐng)注明出處:http://eddy.wiki/interview-java.h...
    eddy_wiki閱讀 2,305評(píng)論 0 14
  • 1. cpu通過時(shí)間片分配算法來循環(huán)執(zhí)行任務(wù),當(dāng)前任務(wù)執(zhí)行一個(gè)時(shí)間片后會(huì)切換到下一任務(wù)。但是,再切換之前會(huì)保存上一...
    冰與河豚魚閱讀 760評(píng)論 0 0

友情鏈接更多精彩內(nèi)容