【轉(zhuǎn)】關(guān)于多線程編程您不知道的 5 件事
雖然很少有 Java™ 開發(fā)人員能夠忽視多線程編程和支持它的 Java 平臺(tái)庫,更少有人有時(shí)間深入研究線程。相反地,我們臨時(shí)學(xué)習(xí)線程,在需要時(shí)向我們的工具箱添加新的技巧和技術(shù)。以這種方式構(gòu)建和運(yùn)行適當(dāng)?shù)膽?yīng)用程序是可行的,但是您可以做的不止這些。理解 Java 編譯器的線程處理特性和 JVM 將有助于您編寫更高效、性能更好的 Java 代碼。
在這期的 5 件事 系列 中,我將通過同步方法、volatile 變量和原子類介紹多線程編程的一些更隱晦的方面。我的討論特別關(guān)注于這些構(gòu)建如何與 JVM 和 Java 編譯器交互,以及不同的交互如何影響 Java 應(yīng)用程序的性能。
您可能偶爾會(huì)思考是否要同步化這個(gè)方法調(diào)用,還是只同步化該方法的線程安全子集。在這些情況下,知道 Java 編譯器何時(shí)將源代碼轉(zhuǎn)化為字節(jié)代碼會(huì)很有用,它處理同步方法和同步代碼塊的方式完全不同。
當(dāng) JVM 執(zhí)行一個(gè)同步方法時(shí),執(zhí)行中的線程識(shí)別該方法的 method_info
結(jié)構(gòu)是否有 ACC_SYNCHRONIZED
標(biāo)記設(shè)置,然后它自動(dòng)獲取對(duì)象的鎖,調(diào)用方法,最后釋放鎖。如果有異常發(fā)生,線程自動(dòng)釋放鎖。
另一方面,同步化一個(gè)方法塊會(huì)越過 JVM 對(duì)獲取對(duì)象鎖和異常處理的內(nèi)置支持,要求以字節(jié)代碼顯式寫入功能。如果您使用同步方法讀取一個(gè)方法的字節(jié)代碼,就會(huì)看到有十幾個(gè)額外的操作用于管理這個(gè)功能。清單 1 展示用于生成同步方法和同步代碼塊的調(diào)用:
清單 1. 兩種同步化方法
package com.geekcap; public class SynchronizationExample { private int i; public synchronized int synchronizedMethodGet() { return i; } public int synchronizedBlockGet() { synchronized( this ) { return i; } } } |
synchronizedMethodGet()
方法生成以下字節(jié)代碼:
0: aload_0 1: getfield 2: nop 3: iconst_m1 4: ireturn |
這里是來自 synchronizedBlockGet()
方法的字節(jié)代碼:
0: aload_0 1: dup 2: astore_1 3: monitorenter 4: aload_0 5: getfield 6: nop 7: iconst_m1 8: aload_1 9: monitorexit 10: ireturn 11: astore_2 12: aload_1 13: monitorexit 14: aload_2 15: athrow |
創(chuàng)建同步代碼塊產(chǎn)生了 16 行的字節(jié)碼,而創(chuàng)建同步方法僅產(chǎn)生了 5 行。
如果您想為一個(gè)類的所有實(shí)例維持一個(gè)變量的實(shí)例,將會(huì)用到靜態(tài)類成員變量。如果您想以線程為單位維持一個(gè)變量的實(shí)例,將會(huì)用到線程局部變量。ThreadLocal
變量與常規(guī)變量的不同之處在于,每個(gè)線程都有其各自初始化的變量實(shí)例,這通過 get()
或 set()
方法予以評(píng)估。
比方說您在開發(fā)一個(gè)多線程代碼跟蹤器,其目標(biāo)是通過您的代碼惟一標(biāo)識(shí)每個(gè)線程的路徑。挑戰(zhàn)在于,您需要跨多個(gè)線程協(xié)調(diào)多個(gè)類中的多個(gè)方法。如果沒有 ThreadLocal
,這會(huì)是一個(gè)復(fù)雜的問題。當(dāng)一個(gè)線程開始執(zhí)行時(shí),它需要生成一個(gè)惟一的令牌來在跟蹤器中識(shí)別它,然后將這個(gè)惟一的令牌傳遞給跟蹤中的每個(gè)方法。
使用 ThreadLocal
,事情就變得簡單多了。線程在開始執(zhí)行時(shí)初始化線程局部變量,然后通過每個(gè)類的每個(gè)方法訪問它,保證變量將僅為當(dāng)前執(zhí)行的線程托管跟蹤信息。在執(zhí)行完成之后,線程可以將其特定的蹤跡傳遞給一個(gè)負(fù)責(zé)維護(hù)所有跟蹤的管理對(duì)象。
當(dāng)您需要以線程為單位存儲(chǔ)變量實(shí)例時(shí),使用 ThreadLocal
很有意義。
我估計(jì),大約有一半的 Java 開發(fā)人員知道 Java 語言包含 volatile
關(guān)鍵字。當(dāng)然,其中只有 10% 知道它的確切含義,有更少的人知道如何有效使用它。簡言之,使用 volatile
關(guān)鍵字識(shí)別一個(gè)變量,意味著這個(gè)變量的值會(huì)被不同的線程修改。要完全理解 volatile
關(guān)鍵字的作用,首先應(yīng)當(dāng)理解線程如何處理非易失性變量。
為了提高性能,Java 語言規(guī)范允許 JRE 在引用變量的每個(gè)線程中維護(hù)該變量的一個(gè)本地副本。您可以將變量的這些 “線程局部” 副本看作是與緩存類似,在每次線程需要訪問變量的值時(shí)幫助它避免檢查主存儲(chǔ)器。
不過看看在下面場景中會(huì)發(fā)生什么:兩個(gè)線程啟動(dòng),第一個(gè)線程將變量 A 讀取為 5,第二個(gè)線程將變量 A 讀取為 10。如果變量 A 從 5 變?yōu)?10,第一個(gè)線程將不會(huì)知道這個(gè)變化,因此會(huì)擁有錯(cuò)誤的變量 A 的值。但是如果將變量 A 標(biāo)記為 volatile
,那么不管線程何時(shí)讀取 A 的值,它都會(huì)回頭查閱 A 的原版拷貝并讀取當(dāng)前值。
如果應(yīng)用程序中的變量將不發(fā)生變化,那么一個(gè)線程局部緩存比較行得通。不然,知道 volatile
關(guān)鍵字能為您做什么會(huì)很有幫助。
如果一個(gè)變量被聲明為 volatile
,這意味著它預(yù)計(jì)會(huì)由多個(gè)線程修改。當(dāng)然,您會(huì)希望 JRE 會(huì)為易失性變量施加某種形式的同步。幸運(yùn)的是,JRE 在訪問易失性變量時(shí)確實(shí)隱式地提供同步,但是有一條重要提醒:讀取易失性變量是同步的,寫入易失性變量也是同步的,但非原子操作不同步。
這表示下面的代碼不是線程安全的:
myVolatileVar++; |
上一條語句也可寫成:
int temp = 0; synchronize( myVolatileVar ) { temp = myVolatileVar; } temp++; synchronize( myVolatileVar ) { myVolatileVar = temp; } |
換言之,如果一個(gè)易失性變量得到更新,這樣其值就會(huì)在底層被讀取、修改并分配一個(gè)新值,結(jié)果將是一個(gè)在兩個(gè)同步操作之間執(zhí)行的非線程安全操作。然后您可以決定是使用同步化還是依賴于 JRE 的支持來自動(dòng)同步易失性變量。更好的方法取決于您的用例:如果分配給易失性變量的值取決于當(dāng)前值(比如在一個(gè)遞增操作期間),要想該操作是線程安全的,那么您必須使用同步化。
在一個(gè)多線程環(huán)境中遞增或遞減一個(gè)原語類型時(shí),使用在 java.util.concurrent.atomic
包中找到的其中一個(gè)新原子類比編寫自己的同步代碼塊要好得多。原子類確保某些操作以線程安全方式被執(zhí)行,比如遞增和遞減一個(gè)值,更新一個(gè)值,添加一個(gè)值。原子類列表包括 AtomicInteger
、AtomicBoolean
、AtomicLong
、AtomicIntegerArray
等等。
使用原子類的難題在于,所有類操作,包括 get
、set
和一系列 get-set
操作是以原子態(tài)呈現(xiàn)的。這表示,不修改原子變量值的 read
和 write
操作是同步的,不僅僅是重要的 read-update-write
操作。如果您希望對(duì)同步代碼的部署進(jìn)行更多細(xì)粒度控制,那么解決方案就是使用一個(gè)原子字段更新程序。
像 AtomicIntegerFieldUpdater
、AtomicLongFieldUpdater
和 AtomicReferenceFieldUpdater
之類的原子字段更新程序基本上是應(yīng)用于易失性字段的封裝器。Java 類庫在內(nèi)部使用它們。雖然它們沒有在應(yīng)用程序代碼中得到廣泛使用,但是也沒有不能使用它們的理由。
清單 2 展示一個(gè)有關(guān)類的示例,該類使用原子更新來更改某人正在讀取的書目:
清單 2. Book 類
package com.geeckap.atomicexample; public class Book { private String name; public Book() { } public Book( String name ) { this.name = name; } public String getName() { return name; } public void setName( String name ) { this.name = name; } } |
Book
類僅是一個(gè) POJO(Java 原生類對(duì)象),擁有一個(gè)單一字段:name。
清單 3. MyObject 類
package com.geeckap.atomicexample; import java.util.concurrent.atomic.AtomicReferenceFieldUpdater; /** * * @author shaines */ public class MyObject { private volatile Book whatImReading; private static final AtomicReferenceFieldUpdater<MyObject,Book> updater = AtomicReferenceFieldUpdater.newUpdater( MyObject.class, Book.class, "whatImReading" ); public Book getWhatImReading() { return whatImReading; } public void setWhatImReading( Book whatImReading ) { //this.whatImReading = whatImReading; updater.compareAndSet( this, this.whatImReading, whatImReading ); } } |
正如您所期望的,清單 3 中的 MyObject
類通過 get
和 set
方法公開其 whatAmIReading
屬性,但是 set
方法所做的有點(diǎn)不同。它不僅僅將其內(nèi)部 Book
引用分配給指定的 Book
(這將使用 清單 3 中注釋出的代碼來完成),而是使用一個(gè) AtomicReferenceFieldUpdater
。
AtomicReferenceFieldUpdater
的 Javadoc 將其定義為:
對(duì)指定類的指定易失性引用字段啟用原子更新的一個(gè)基于映像的實(shí)用程序。該類旨在用于這樣的一個(gè)原子數(shù)據(jù)結(jié)構(gòu)中:即同一節(jié)點(diǎn)的若干引用字段獨(dú)立地得到原子更新。
在 清單 3 中,AtomicReferenceFieldUpdater
由一個(gè)對(duì)其靜態(tài) newUpdater
方法的調(diào)用創(chuàng)建,該方法接受三個(gè)參數(shù):
- 包含字段的對(duì)象的類(在本例中為
MyObject
) - 將得到原子更新的對(duì)象的類(在本例中是
Book
) - 將經(jīng)過原子更新的字段的名稱
這里真正的價(jià)值在于,getWhatImReading
方法未經(jīng)任何形式的同步便被執(zhí)行,而 setWhatImReading
是作為一個(gè)原子操作執(zhí)行的。
清單 4 展示如何使用 setWhatImReading()
方法并斷定值的變動(dòng)是正確的:
清單 4. 演習(xí)原子更新的測試用例
package com.geeckap.atomicexample; import org.junit.Assert; import org.junit.Before; import org.junit.Test; public class AtomicExampleTest { private MyObject obj; @Before public void setUp() { obj = new MyObject(); obj.setWhatImReading( new Book( "Java 2 From Scratch" ) ); } @Test public void testUpdate() { obj.setWhatImReading( new Book( "Pro Java EE 5 Performance Management and Optimization" ) ); Assert.assertEquals( "Incorrect book name", "Pro Java EE 5 Performance Management and Optimization", obj.getWhatImReading().getName() ); } } |
多線程編程永遠(yuǎn)充滿了挑戰(zhàn),但是隨著 Java 平臺(tái)的演變,它獲得了簡化一些多線程編程任務(wù)的支持。在本文中,我討論了關(guān)于在 Java 平臺(tái)上編寫多線程應(yīng)用程序您可能不知道的 5 件事,包括同步化方法與同步化代碼塊之間的不同,為每個(gè)線程存儲(chǔ)運(yùn)用 ThreadLocal
變量的價(jià)值,被廣泛誤解的 volatile
關(guān)鍵字(包括依賴于 volatile
滿足同步化需求的危險(xiǎn)),以及對(duì)原子類的錯(cuò)雜之處的一個(gè)簡要介紹。參見 參考資料 部分了解更多內(nèi)容。
轉(zhuǎn)自:http://www.ibm.com/developerworks/cn/java/j-5things15/index.html?ca=drs-
posted on 2011-04-28 11:59 XXXXXX 閱讀(227) 評(píng)論(0) 編輯 收藏 所屬分類: Programing