都市淘沙者

荔枝FM Everyone can be host

公告

我的blog中的部分資源是來自于網絡上，如果你認為侵犯了你的權利，請及時聯系jelver#163.com,我會盡快刪除！另外如果要留言最好通過郵件的形式跟我交流因為我不是很經常寫文章，前面有的朋友留言好久了我才發現，所以對不住大家，現在留下MSN:jelver#163.com和QQ：253840881,歡迎交流！（用@代替#）

隨筆分類

文章分類

隨筆檔案

文章檔案

相冊

我們一家

統計

隨筆 - 65
文章 - 359
評論 - 122
引用 - 0

留言簿(23)

積分與排名

積分 - 564150
排名 - 85

優秀學習網站

Android 優秀源碼站點 (rss)
Android圖標資源 (rss)
DOM學習的好地方
EJB3.0中文學習
EJB開發 (rss)
Hibernate Man
http://www.java3z.com
javabloger 優秀網站 (rss)
JSTL學習
SSH實例學習好BLOG (rss)
Struts2.0系列文章 (rss)
tapestry wiki
UML技術指南
前端研究好站
國內LAMP組織
在線API查詢 (rss)
http://www.gotapi.com/
孫衛琴論壇 (rss)
開源pdf閱讀器
http://code.google.com/p/ebookdroid/ 非常給力 http://my.oschina.net/ernest/blog/16999
手機設計應用
手機GUI資訊
英文電子書下載
高級運維 (rss)
高級運維

友情連接

AJAX (rss)
ajax資料
bst.cublog.cn
EJB學習例子 (rss)
hibernate+Spring好資料
HR面試，英語面試資料 (rss)
Javamxj
java海鷗
Java自由人
limq
mayu博客
moxie
Oksonic'Blog
spring /tapestry
spring sky
thunderzhulei的專欄
干煸四季豆
很多好的java資源
曹曉剛blog
江南白衣之射殺鋼琴師
溫昱說圖
滿江紅
老妖
螞蟻小窩----為而不爭
鄧應華的小站
鐵手大人

閱讀排行榜

評論排行榜

一.Java并發基礎

當一個對象或變量可以被多個線程共享的時候，就有可能使得程序的邏輯出現問題。
在一個對象中有一個變量i=0，有兩個線程A，B都想對i加1，這個時候便有問題顯現出來，關鍵就是對i加1的這個過程不是原子操作。要想對i進行遞增，第一步就是獲取i的值，當A獲取i的值為0，在A將新的值寫入A之前，B也獲取了A的值0，然后A寫入，i變成1，然后B也寫入i，i這個時候依然是1.
當然java的內存模型沒有上面這么簡單，在Java Memory Model中，Memory分為兩類，

main memory和working memory，main memory為所有線程共享，working memory中存放的是線程所需要的變量的拷貝（線程要對main memory中的內容進行操作的話，首先需要拷貝到自己的working memory，一般為了速度，working memory一般是在cpu的cache中的）。volatile的變量在被操作的時候不會產生working memory的拷貝，而是直接操作main memory，當然volatile雖然解決了變量的可見性問題，但沒有解決變量操作的原子性的問題，這個還需要synchronized或者CAS相關操作配合進行。

多線程中幾個重要的概念:

可見性

也就說假設一個對象中有一個變量i，那么i是保存在main memory中的，當某一個線程要操作i的時候，首先需要從main memory中將i 加載到這個線程的working memory中，這個時候working memory中就有了一個i的拷貝，這個時候此線程對i的修改都在其working memory中，直到其將i從working memory寫回到main memory中，新的i的值才能被其他線程所讀取。從某個意義上說，可見性保證了各個線程的working memory的數據的一致性。
可見性遵循下面一些規則：

當一個線程運行結束的時候，所有寫的變量都會被flush回main memory中。
當一個線程第一次讀取某個變量的時候，會從main memory中讀取最新的。
volatile的變量會被立刻寫到main memory中的，在jsr133中，對volatile的語義進行增強，后面會提到
當一個線程釋放鎖后，所有的變量的變化都會flush到main memory中，然后一個使用了這個相同的同步鎖的進程，將會重新加載所有的使用到的變量，這樣就保證了可見性。

原子性

還拿上面的例子來說，原子性就是當某一個線程修改i的值的時候，從取出i到將新的i的值寫給i之間不能有其他線程對i進行任何操作。也就是說保證某個線程對i的操作是原子性的，這樣就可以避免數據臟讀。
通過鎖機制或者CAS（Compare And Set 需要硬件CPU的支持）操作可以保證操作的原子性。

有序性

假設在main memory中存在兩個變量i和j，初始值都為0，在某個線程A的代碼中依次對i和j進行自增操作（i，j的操作不相互依賴），

1
2

i++;
j++;

由于，所以i,j修改操作的順序可能會被重新排序。那么修改后的ij寫到main memory中的時候，順序可能就不是按照i，j的順序了，這就是所謂的reordering，在單線程的情況下，當線程A運行結束的后i，j的值都加1了，在線程自己看來就好像是線程按照代碼的順序進行了運行（這些操作都是基于as-if- serial語義的），即使在實際運行過程中，i，j的自增可能被重新排序了，當然計算機也不能幫你亂排序，存在上下邏輯關聯的運行順序肯定還是不會變的。但是在多線程環境下，問題就不一樣了，比如另一個線程B的代碼如下

1
2
3

if(j==1) {
System.out.println(i);
}

按照我們的思維方式，當j為1的時候那么i肯定也是1，因為代碼中i在j之前就自增了，但實際的情況有可能當j為1的時候i還是為0。這就是 reordering產生的不好的后果，所以我們在某些時候為了避免這樣的問題需要一些必要的策略，以保證多個線程一起工作的時候也存在一定的次序。 JMM提供了happens-before 的排序策略。這樣我們可以得到多線程環境下的as-if-serial語義。
這里不對happens-before進行詳細解釋了,詳細的請看這里http://www.ibm.com/developerworks/cn/java/j-jtp03304/，這里主要講一下volatile在新的java內存模型下的變化，在jsr133之前，下面的代碼可能會出現問題

1
2
3
4
5
6
7
8
9
10
11
12

Map configOptions;
char[] configText;
volatile boolean initialized = false;
// In Thread A
configOptions = new HashMap();
configText = readConfigFile(fileName);
processConfigOptions(configText, configOptions);
initialized = true;
// In Thread B
while (!initialized)
sleep();
// use configOptions

jsr133之前，雖然對 volatile 變量的讀和寫不能與對其他 volatile 變量的讀和寫一起重新排序，但是它們仍然可以與對 nonvolatile 變量的讀寫一起重新排序，所以上面的Thread A的操作，就可能initialized變成true的時候，而configOptions還沒有被初始化，所以initialized先于 configOptions被線程B看到，就產生問題了。

JSR 133 Expert Group 決定讓 volatile 讀寫不能與其他內存操作一起重新排序，新的內存模型下，如果當線程 A 寫入 volatile 變量 V 而線程 B 讀取 V 時，那么在寫入 V 時，A 可見的所有變量值現在都可以保證對 B 是可見的。

結果就是作用更大的 volatile 語義，代價是訪問 volatile 字段時會對性能產生更大的影響。這一點在ConcurrentHashMap中的統計某個segment元素個數的count變量中使用到了。

二.線程安全的HashMap

什么時候我們需要使用線程安全的hashmap呢，比如一個hashmap在運行的時候只有讀操作，那么很明顯不會有問題，但是當涉及到同時有改變也有讀的時候，就要考慮線程安全問題了，在不考慮性能問題的時候，我們的解決方案有Hashtable或者 Collections.synchronizedMap(hashMap)，這兩種方式基本都是對整個hash表結構做鎖定操作的，這樣在鎖表的期間，別的線程就需要等待了，無疑性能不高。

三.ConcurrentHashMap實現原理

數據結構

ConcurrentHashMap的目標是實現支持高并發、高吞吐量的線程安全的HashMap。當然不能直接對整個hashtable加鎖，所以在ConcurrentHashMap中，數據的組織結構和HashMap有所區別。

一個ConcurrentHashMap由多個segment組成，每一個segment都包含了一個HashEntry數組的hashtable，
每一個segment包含了對自己的hashtable的操作，比如get，put，replace等操作，這些操作發生的時候，對自己的 hashtable進行鎖定。由于每一個segment寫操作只鎖定自己的hashtable，所以可能存在多個線程同時寫的情況，性能無疑好于只有一個 hashtable鎖定的情況。

源碼分析

在ConcurrentHashMap的remove，put操作還是比較簡單的，都是將remove或者put操作交給key所對應的segment去做的，所以當幾個操作不在同一個segment的時候就可以并發的進行。

1
2
3
4

public V remove(Object key) {
int hash = hash(key.hashCode());
return segmentFor(hash).remove(key, hash, null);
}

而segment中的remove操作除了加鎖之外和HashMap中的remove操作基本無異。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

/**
* Remove; match on key only if value null, else match both.
*/
V remove(Object key, int hash, Object value) {
lock();
try {
int c = count - 1;
HashEntry<K,V>[] tab = table;
int index = hash & (tab.length - 1);
HashEntry<K,V> first = tab[index];
HashEntry<K,V> e = first;
while (e != null && (e.hash != hash || !key.equals(e.key)))
e = e.next;

V oldValue = null;
if (e != null) {
V v = e.value;
if (value == null || value.equals(v)) {
oldValue = v;
// All entries following removed node can stay
// in list, but all preceding ones need to be
// cloned.
++modCount;
HashEntry<K,V> newFirst = e.next;
for (HashEntry<K,V> p = first; p != e; p = p.next)
newFirst = new HashEntry<K,V>(p.key, p.hash,
newFirst, p.value);
tab[index] = newFirst;
count = c; // write-volatile
}
}
return oldValue;
} finally {
unlock();
}
}

上面的代碼中關于volatile類型的變量count值得一提，這里充分利用了Java 5中對volatile語義的增強，count = c的操作必須在modCount，table等操作的后面，這樣才能保證這些變量操作的可見性。
Segment類繼承于ReentrantLock，主要是為了使用ReentrantLock的鎖，ReentrantLock的實現比
synchronized在多個線程爭用下的總體開銷小。
put操作和remove操作類似。

接下來我們來看下get操作。

1
2
3
4

public V get(Object key) {
int hash = hash(key.hashCode());
return segmentFor(hash).get(key, hash);
}

也是使用了對應的segment的get

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

V get(Object key, int hash) {
if (count != 0) { // read-volatile
HashEntry<K,V> e = getFirst(hash);
while (e != null) {
if (e.hash == hash && key.equals(e.key)) {
V v = e.value;
if (v != null)
return v;
return readValueUnderLock(e); // recheck
}
e = e.next;
}
}
return null;
}

上面的代碼中，一開始就對volatile變量count進行了讀取比較，這個還是java5對volatile語義增強的作用，這樣就可以獲取變量的可見性。所以count != 0之后，我們可以認為對應的hashtable是最新的，當然由于讀取的時候沒有加鎖，在get的過程中，可能會有更新。當發現根據key去找元素的時候，但發現找得的key對應的value為null，這個時候可能會有其他線程正在對這個元素進行寫操作，所以需要在使用鎖的情況下在讀取一下 value，以確保最終的值。

其他相關涉及讀取的操作也都類似。

posted on 2010-12-07 10:50 都市淘沙者閱讀(876) 評論(0) 編輯收藏所屬分類: Java Basic/Lucene/開源資料

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: BeanComparator實現ArrayList復合排序[轉] 開源中最好的Web開發的資源 java中傳輸對象時候的問題（轉） Java Float類型減法運算時精度丟失問題 ConcurrentHashMap原理分析 http請求的詳細過程【推薦】既有魚肉又有熊掌——ListOrderedMap JAVA異常詳解 javaIO總結 j2ee的性能調優