在看java performance的時(shí)候看到一些同步的名詞,偏向鎖、輕量級(jí)鎖之類的,于是想先了解一下虛擬機(jī)中的鎖機(jī)制,于是找到了這篇文章。發(fā)現(xiàn)是《深入理解Java虛擬機(jī):JVM高級(jí)特性與最佳實(shí)踐》一書(shū)的章節(jié),講得干脆好懂,差點(diǎn)就有要去買一本的沖動(dòng)-----還是明天吧。以下是文章轉(zhuǎn)載:
------------------------------------------------------------------------------------------------------------------------------------------------------------------
高效并發(fā)是JDK1.6的一個(gè)重要主題,HotSpot虛擬機(jī)開(kāi)發(fā)團(tuán)隊(duì)在這個(gè)版本上花費(fèi)了大量的精力去實(shí)現(xiàn)各種鎖優(yōu)化技術(shù),如適應(yīng)性自旋 (AdaptiveSpinning)、鎖削除(Lock Elimination)、鎖膨脹(Lock Coarsening)、輕量級(jí)鎖(LightweightLocking)、偏向鎖(BiasedLocking)等,這些技術(shù)都是為了在線程之間更高 效地共享數(shù)據(jù),以及解決競(jìng)爭(zhēng)問(wèn)題,從而提高程序的執(zhí)行效率。
13.3.1 自旋鎖與自適應(yīng)自旋
前面我們討論互斥同步的時(shí)候,提到了互斥同步對(duì)性能最大的影響是阻塞的實(shí)現(xiàn),掛起線程和恢復(fù)線程的操作都需要轉(zhuǎn)入內(nèi)核態(tài)中完成,這些操作給系統(tǒng)的并發(fā) 性能帶來(lái)了很大的壓力。同時(shí),虛擬機(jī)的開(kāi)發(fā)團(tuán)隊(duì)也注意到在許多應(yīng)用上,共享數(shù)據(jù)的鎖定狀態(tài)只會(huì)持續(xù)很短的一段時(shí)間,為了這段時(shí)間去掛起和恢復(fù)線程并不值 得。如果物理機(jī)器有一個(gè)以上的處理器,能讓兩個(gè)或以上的線程同時(shí)并行執(zhí)行,我們就可以讓后面請(qǐng)求鎖的那個(gè)線程“稍等一會(huì)”,但不放棄處理器的執(zhí)行時(shí)間,看 看持有鎖的線程是否很快就會(huì)釋放鎖。為了讓線程等待,我們只須讓線程執(zhí)行一個(gè)忙循環(huán)(自旋),這項(xiàng)技術(shù)就是所謂的自旋鎖。
自旋鎖在JDK 1.4.2中就已經(jīng)引入,只不過(guò)默認(rèn)是關(guān)閉的,可以使用-XX:+UseSpinning參數(shù)來(lái)開(kāi)啟,在JDK1.6中就已經(jīng)改為默認(rèn)開(kāi)啟了。自旋等待不 能代替阻塞,且先不說(shuō)對(duì)處理器數(shù)量的要求,自旋等待本身雖然避免了線程切換的開(kāi)銷,但它是要占用處理器時(shí)間的,所以如果鎖被占用的時(shí)間很短,自旋等待的效 果就會(huì)非常好,反之如果鎖被占用的時(shí)間很長(zhǎng),那么自旋的線程只會(huì)白白消耗處理器資源,而不會(huì)做任何有用的工作,反而會(huì)帶來(lái)性能的浪費(fèi)。因此自旋等待的時(shí)間 必須要有一定的限度,如果自旋超過(guò)了限定的次數(shù)仍然沒(méi)有成功獲得鎖,就應(yīng)當(dāng)使用傳統(tǒng)的方式去掛起線程了。自旋次數(shù)的默認(rèn)值是10次,用戶可以使用參數(shù) -XX:PreBlockSpin來(lái)更改。
在JDK1.6中引入了自適應(yīng)的自旋鎖。自適應(yīng)意味著自旋的時(shí)間不再固定了,而是由前一次在同一個(gè)鎖上的自旋時(shí)間及鎖的擁有者的狀態(tài)來(lái)決定。如果在同 一個(gè)鎖對(duì)象上,自旋等待剛剛成功獲得過(guò)鎖,并且持有鎖的線程正在運(yùn)行中,那么虛擬機(jī)就會(huì)認(rèn)為這次自旋也很有可能再次成功,進(jìn)而它將允許自旋等待持續(xù)相對(duì)更 長(zhǎng)的時(shí)間,比如100個(gè)循環(huán)。另一方面,如果對(duì)于某個(gè)鎖,自旋很少成功獲得過(guò),那在以后要獲取這個(gè)鎖時(shí)將可能省略掉自旋過(guò)程,以避免浪費(fèi)處理器資源。有了 自適應(yīng)自旋,隨著程序運(yùn)行和性能監(jiān)控信息的不斷完善,虛擬機(jī)對(duì)程序鎖的狀況預(yù)測(cè)就會(huì)越來(lái)越準(zhǔn)確,虛擬機(jī)就會(huì)變得越來(lái)越“聰明”了。
13.3.2 鎖削除
鎖削除是指虛擬機(jī)即時(shí)編譯器在運(yùn)行時(shí),對(duì)一些代碼上要求同步,但是被檢測(cè)到不可能存在共享數(shù)據(jù)競(jìng)爭(zhēng)的鎖進(jìn)行削除。鎖削除的主要判定依據(jù)來(lái)源于逃逸分析 的數(shù)據(jù)支持(第11章已經(jīng)講解過(guò)逃逸分析技術(shù)),如果判斷到一段代碼中,在堆上的所有數(shù)據(jù)都不會(huì)逃逸出去被其他線程訪問(wèn)到,那就可以把它們當(dāng)作棧上數(shù)據(jù)對(duì) 待,認(rèn)為它們是線程私有的,同步加鎖自然就無(wú)須進(jìn)行。
也許讀者會(huì)有疑問(wèn),變量是否逃逸,對(duì)于虛擬機(jī)來(lái)說(shuō)需要使用數(shù)據(jù)流分析來(lái)確定,但是程序員自己應(yīng)該是很清楚的,怎么會(huì)在明知道不存在數(shù)據(jù)爭(zhēng)用的情況下要 求同步呢?答案是有許多同步措施并不是程序員自己加入的,同步的代碼在Java程序中的普遍程度也許超過(guò)了大部分讀者的想象。我們來(lái)看看下面代碼清單 13-6中的例子,這段非常簡(jiǎn)單的代碼僅僅是輸出三個(gè)字符串相加的結(jié)果,無(wú)論是源碼字面上還是程序語(yǔ)義上都沒(méi)有同步。
代碼清單 13-6 一段看起來(lái)沒(méi)有同步的代碼
- public String concatString(String s1, String s2, String s3) {
- return s1 + s2 + s3;
- }
代碼清單 13-7 Javac轉(zhuǎn)化后的字符串連接操作
- public String concatString(String s1, String s2, String s3) {
- StringBuffer sb = new StringBuffer();
- sb.append(s1);
- sb.append(s2);
- sb.append(s3);
- return sb.toString();
- }
- public String concatString(String s1, String s2, String s3) {
- StringBuffer sb = new StringBuffer();
- sb.append(s1);
- sb.append(s2);
- sb.append(s3);
- return sb.toString();
- }
現(xiàn)在大家還認(rèn)為這段代碼沒(méi)有涉及同步嗎?每個(gè)StringBuffer.append()方法中都有一個(gè)同步塊,鎖就是sb對(duì)象。虛擬機(jī)觀察變量 sb,很快就會(huì)發(fā)現(xiàn)它的動(dòng)態(tài)作用域被限制在concatString()方法內(nèi)部。也就是sb的所有引用永遠(yuǎn)不會(huì)“逃逸”到concatString() 方法之外,其他線程無(wú)法訪問(wèn)到它,所以這里雖然有鎖,但是可以被安全地削除掉,在即時(shí)編譯之后,這段代碼就會(huì)忽略掉所有的同步而直接執(zhí)行了。
13.3.3 鎖膨脹
原則上,我們?cè)诰帉懘a的時(shí)候,總是推薦將同步塊的作用范圍限制得盡量小——只在共享數(shù)據(jù)的實(shí)際作用域中才進(jìn)行同步,這樣是為了使得需要同步的操作數(shù)量盡可能變小,如果存在鎖競(jìng)爭(zhēng),那等待鎖的線程也能盡快地拿到鎖。
大部分情況下,上面的原則都是正確的,但是如果一系列的連續(xù)操作都對(duì)同一個(gè)對(duì)象反復(fù)加鎖和解鎖,甚至加鎖操作是出現(xiàn)在循環(huán)體中的,那即使沒(méi)有線程競(jìng)爭(zhēng),頻繁地進(jìn)行互斥同步操作也會(huì)導(dǎo)致不必要的性能損耗。
上面代碼清單13-7中連續(xù)的append()方法就屬于這類情況。如果虛擬機(jī)探測(cè)到有這樣一串零碎的操作都對(duì)同一個(gè)對(duì)象加鎖,將會(huì)把加鎖同步的范圍 擴(kuò)展(膨脹)到整個(gè)操作序列的外部,以代碼清單13-7為例,就是擴(kuò)展到第一個(gè)append()操作之前直至最后一個(gè)append()操作之后,這樣只需 要加鎖一次就可以了。
13.3.4 輕量級(jí)鎖
輕量級(jí)鎖是JDK1.6之中加入的新型鎖機(jī)制,它名字中的“輕量級(jí)”是相對(duì)于使用操作系統(tǒng)互斥量來(lái)實(shí)現(xiàn)的傳統(tǒng)鎖而言的,因此傳統(tǒng)的鎖機(jī)制就被稱為“重 量級(jí)”鎖。首先需要強(qiáng)調(diào)一點(diǎn)的是,輕量級(jí)鎖并不是用來(lái)代替重量級(jí)鎖的,它的本意是在沒(méi)有多線程競(jìng)爭(zhēng)的前提下,減少傳統(tǒng)的重量級(jí)鎖使用操作系統(tǒng)互斥量產(chǎn)生的 性能消耗。
要理解輕量級(jí)鎖,以及后面會(huì)講到的偏向鎖的原理和運(yùn)作過(guò)程,必須從HotSpot虛擬機(jī)的對(duì)象(對(duì)象頭部分)的內(nèi)存布局開(kāi)始介紹。HotSpot虛擬 機(jī)的對(duì)象頭(ObjectHeader)分為兩部分信息,第一部分用于存儲(chǔ)對(duì)象自身的運(yùn)行時(shí)數(shù)據(jù),如哈希碼(HashCode)、GC分代年齡 (Generational GCAge)等,這部分?jǐn)?shù)據(jù)的長(zhǎng)度在32位和64位的虛擬機(jī)中分別為32個(gè)和64個(gè)Bits,官方稱它為“MarkWord”,它是實(shí)現(xiàn)輕量級(jí)鎖和偏向鎖 的關(guān)鍵。另外一部分用于存儲(chǔ)指向方法區(qū)對(duì)象類型數(shù)據(jù)的指針,如果是數(shù)組對(duì)象的話,還會(huì)有一個(gè)額外的部分用于存儲(chǔ)數(shù)組長(zhǎng)度。
對(duì)象頭信息是與對(duì)象自身定義的數(shù)據(jù)無(wú)關(guān)的額外存儲(chǔ)成本,考慮到虛擬機(jī)的空間效率,MarkWord被設(shè)計(jì)成一個(gè)非固定的數(shù)據(jù)結(jié)構(gòu)以便在極小的空間內(nèi)存 儲(chǔ)盡量多的信息,它會(huì)根據(jù)對(duì)象的狀態(tài)復(fù)用自己的存儲(chǔ)空間。例如在32位的HotSpot虛擬機(jī)中對(duì)象未被鎖定的狀態(tài)下,MarkWord的32個(gè)Bits 空間中的25Bits用于存儲(chǔ)對(duì)象哈希碼(HashCode),4Bits用于存儲(chǔ)對(duì)象分代年齡,2Bits用于存儲(chǔ)鎖標(biāo)志位,1Bit固定為0,在其他 狀態(tài)(輕量級(jí)鎖定、重量級(jí)鎖定、GC標(biāo)記、可偏向)下對(duì)象的存儲(chǔ)內(nèi)容如表13-1所示。
表13-1 HotSpot虛擬機(jī)對(duì)象頭Mark Word
存儲(chǔ)內(nèi)容 | 標(biāo)志位 | 狀態(tài) |
對(duì)象哈希碼、對(duì)象分代年齡 | 01 | 未鎖定 |
指向鎖記錄的指針 | 00 | 輕量級(jí)鎖定 |
指向重量級(jí)鎖的指針 | 10 | 膨脹(重量級(jí)鎖定) |
空,不需要記錄信息 | 11 | GC標(biāo)記 |
偏向線程ID、偏向時(shí)間戳、對(duì)象分代年齡 | 01 | 可偏向 |
簡(jiǎn)單地介紹完了對(duì)象的內(nèi)存布局,我們把話題返回到輕量級(jí)鎖的執(zhí)行過(guò)程上。在代碼進(jìn)入同步塊的時(shí)候,如果此同步對(duì)象沒(méi)有被鎖定(鎖標(biāo)志位為“01”狀 態(tài)),虛擬機(jī)首先將在當(dāng)前線程的棧幀中建立一個(gè)名為鎖記錄(Lock Record)的空間,用于存儲(chǔ)鎖對(duì)象目前的MarkWord的拷貝(官方把這份拷貝加了一個(gè)Displaced前綴,即Displaced MarkWord),這時(shí)候線程堆棧與對(duì)象頭的狀態(tài)如圖13-3所示。

圖13-3 輕量級(jí)鎖CAS操作之前堆棧與對(duì)象的狀態(tài)
然后,虛擬機(jī)將使用CAS操作嘗試將對(duì)象的Mark Word更新為指向LockRecord的指針。如果這個(gè)更新動(dòng)作成功了,那么這個(gè)線程就擁有了該對(duì)象的鎖,并且對(duì)象Mark Word的鎖標(biāo)志位(MarkWord的最后兩個(gè)Bits)將轉(zhuǎn)變?yōu)?#8220;00”,即表示此對(duì)象處于輕量級(jí)鎖定狀態(tài),這時(shí)候線程堆棧與對(duì)象頭的狀態(tài)如圖 13-4所示。

圖13-4 輕量級(jí)鎖CAS操作之后堆棧與對(duì)象的狀態(tài)
(注2:圖13-3和圖13-4來(lái)源于HotSpot虛擬機(jī)的一位Senior Staff Engineer——Paul Hohensee所寫的PPT《The Hotspot Java Virtual Machine》)
如果這個(gè)更新操作失敗了,虛擬機(jī)首先會(huì)檢查對(duì)象的MarkWord是否指向當(dāng)前線程的棧幀,如果是就說(shuō)明當(dāng)前線程已經(jīng)擁有了這個(gè)對(duì)象的鎖,那就可以直 接進(jìn)入同步塊繼續(xù)執(zhí)行,否則說(shuō)明這個(gè)鎖對(duì)象已經(jīng)被其他線程搶占了。如果有兩條以上的線程爭(zhēng)用同一個(gè)鎖,那輕量級(jí)鎖就不再有效,要膨脹為重量級(jí)鎖,鎖標(biāo)志的 狀態(tài)值變?yōu)?#8220;10”,MarkWord中存儲(chǔ)的就是指向重量級(jí)鎖(互斥量)的指針,后面等待鎖的線程也要進(jìn)入阻塞狀態(tài)。
上面描述的是輕量級(jí)鎖的加鎖過(guò)程,它的解鎖過(guò)程也是通過(guò)CAS操作來(lái)進(jìn)行的,如果對(duì)象的MarkWord仍然指向著線程的鎖記錄,那就用CAS操作把 對(duì)象當(dāng)前的Mark Word和線程中復(fù)制的Displaced MarkWord替換回來(lái),如果替換成功,整個(gè)同步過(guò)程就完成了。如果替換失敗,說(shuō)明有其他線程嘗試過(guò)獲取該鎖,那就要在釋放鎖的同時(shí),喚醒被掛起的線 程。
輕量級(jí)鎖能提升程序同步性能的依據(jù)是“對(duì)于絕大部分的鎖,在整個(gè)同步周期內(nèi)都是不存在競(jìng)爭(zhēng)的”,這是一個(gè)經(jīng)驗(yàn)數(shù)據(jù)。如果沒(méi)有競(jìng)爭(zhēng),輕量級(jí)鎖使用CAS 操作避免了使用互斥量的開(kāi)銷,但如果存在鎖競(jìng)爭(zhēng),除了互斥量的開(kāi)銷外,還額外發(fā)生了CAS操作,因此在有競(jìng)爭(zhēng)的情況下,輕量級(jí)鎖會(huì)比傳統(tǒng)的重量級(jí)鎖更慢。
13.3.5 偏向鎖
偏向鎖也是JDK1.6中引入的一項(xiàng)鎖優(yōu)化,它的目的是消除數(shù)據(jù)在無(wú)競(jìng)爭(zhēng)情況下的同步原語(yǔ),進(jìn)一步提高程序的運(yùn)行性能。如果說(shuō)輕量級(jí)鎖是在無(wú)競(jìng)爭(zhēng)的情況下使用CAS操作去消除同步使用的互斥量,那偏向鎖就是在無(wú)競(jìng)爭(zhēng)的情況下把整個(gè)同步都消除掉,連CAS操作都不做了。
偏向鎖的“偏”,就是偏心的“偏”、偏袒的“偏”。它的意思是這個(gè)鎖會(huì)偏向于第一個(gè)獲得它的線程,如果在接下來(lái)的執(zhí)行過(guò)程中,該鎖沒(méi)有被其他的線程獲取,則持有偏向鎖的線程將永遠(yuǎn)不需要再進(jìn)行同步。
如果讀者讀懂了前面輕量級(jí)鎖中關(guān)于對(duì)象頭MarkWord與線程之間的操作過(guò)程,那偏向鎖的原理理解起來(lái)就會(huì)很簡(jiǎn)單。假設(shè)當(dāng)前虛擬機(jī)啟用了偏向鎖(啟 用參數(shù)-XX:+UseBiasedLocking,這是JDK1.6的默認(rèn)值),那么,當(dāng)鎖對(duì)象第一次被線程獲取的時(shí)候,虛擬機(jī)將會(huì)把對(duì)象頭中的標(biāo)志位 設(shè)為“01”,即偏向模式。同時(shí)使用CAS操作把獲取到這個(gè)鎖的線程的ID記錄在對(duì)象的MarkWord之中,如果CAS操作成功,持有偏向鎖的線程以后 每次進(jìn)入這個(gè)鎖相關(guān)的同步塊時(shí),虛擬機(jī)都可以不再進(jìn)行任何同步操作(例如Locking、Unlocking及對(duì)Mark Word的Update等)。
當(dāng)有另外一個(gè)線程去嘗試獲取這個(gè)鎖時(shí),偏向模式就宣告結(jié)束。根據(jù)鎖對(duì)象目前是否處于被鎖定的狀態(tài),撤銷偏向(RevokeBias)后恢復(fù)到未鎖定 (標(biāo)志位為“01”)或輕量級(jí)鎖定(標(biāo)志位為“00”)的狀態(tài),后續(xù)的同步操作就如上面介紹的輕量級(jí)鎖那樣執(zhí)行。偏向鎖、輕量級(jí)鎖的狀態(tài)轉(zhuǎn)化及對(duì)象 Mark Word的關(guān)系如圖13-5所示。

圖13-5 偏向鎖、輕量級(jí)鎖的狀態(tài)轉(zhuǎn)化及對(duì)象Mark Word的關(guān)系
偏向鎖可以提高帶有同步但無(wú)競(jìng)爭(zhēng)的程序性能。它同樣是一個(gè)帶有效益權(quán)衡(TradeOff)性質(zhì)的優(yōu)化,也就是說(shuō)它并不一定總是對(duì)程序運(yùn)行有 利,如果程序中大多數(shù)的鎖都總是被多個(gè)不同的線程訪問(wèn),那偏向模式就是多余的。在具體問(wèn)題具體分析的前提下,有時(shí)候使用參數(shù) -XX:-UseBiasedLocking來(lái)禁止偏向鎖優(yōu)化反而可以提升性能。
來(lái)源:《深入理解Java虛擬機(jī):JVM高級(jí)特性與最佳實(shí)踐》