posts - 167, comments - 30, trackbacks - 0

源代碼分析之HashMap

基礎很重要哦...

1. HashMap工作原理：

HashMap是基于Hash表的Map接口的非同步實現。此實現提供所有可選的映射操作，并允許使用null作為鍵和值。無序。

2. HashMap數據結構：

HashMap實際上是一個“鏈表散列”的數據結構，即是數組和鏈表的結合體。HashMap底層就是個數組結構，數組的每一項是一個鏈表。當新建一個HashMap時，就會新創建一個數組。

Java代碼：

/**

* 長度擴容必須是2的倍數

*/

transient Entry[] table;

static class Entry<K,V> implements Map.Entry<K,V> {

final K key;

V value;

Entry<K,V> next;

final int hash;

… …

public HashMap() {

this.loadFactor = DEFAULT_LOAD_FACTOR;

threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);

table = new Entry[DEFAULT_INITIAL_CAPACITY];

init();

}

可以看到，每個Entry就是一個鍵值對，本身對象持有下一個對象的引用，這樣就構成了鏈表。

為了元素在HashMap中均勻分布，通常想到的是把hashCode對數組長度取模運算，但是取模運算的消耗比較大，那么HashMap做法是根據key算的的hashCode跟數組-1進行“與”運算(&)。

將初始大小設置為16的原因(當擴容是必須是2的整數次冪)：主要為了使HashMap的訪問的性能最高，減少key在bucket中存取時的碰撞幾率。

3. HashMap的resize：

當HashMap的元素越來越多時，碰撞的幾率就越來越高，因為數組的長度初始時是固定的，所以為了提高查詢的效率，就要對HashMap的數組進行擴容，在HashMap數組擴容后最消耗性能點是：原數組中的元素必須重新計算在新數組中的位置，然后存放進去。

什么時候擴容？

當HashMap中的元素個數超過數組大小*負載因子的時，會進行數組擴容，默認的loadFactor是0.75（意思是當一個Map填滿了75%bucket的時），也就是當為12（16*0.75），就會把數組擴容原來大小的兩倍：16*2=32。然后重新計算每個元素在數組中的位置（此時比較消耗性能了）。這個過程也叫做rehashing（因為它調用了hash方法找到新bucket的位置）。

建議當我們已預知了數組的元素個數，可根據具體需求自行設置數組初始容量以便提高查詢性能。但是要記得考慮“&”的問題。這樣也解決了resize的問題。

4. HashMap的存取實現：

put方法分析：

如果傳入key為null值，則將其放倒數組的第一個位置。如果key不為空，首先對key調用hashCode方法，對返回的hashCode值做hash，通過計算hash值可以找到bucket(這個bucket就是指Entry數組)位置(下標)來存儲Entry對象。

public V put(K key, V value) {

if (key == null)

return putForNullKey(value);

int hash = hash(key.hashCode());

int i = indexFor(hash, table.length);

for (Entry<K,V> e = table[i]; e != null; e = e.next) {

Object k;

if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {

V oldValue = e.value;

e.value = value;

e.recordAccess(this);

return oldValue;

}

modCount++;

addEntry(hash, key, value, i);

return null;

}

雖然發生碰撞的幾率較小，但是如果發生碰撞，則會將新添加的元素放倒鏈表頭部，早先加入的元素放倒鏈表尾部（我們可以將發生碰撞的這個鏈表理解為LinkedList，這個LinkedList中存儲了鍵值對形式的Map.Entry對象）。

void addEntry(int hash, K key, V value, int bucketIndex) {

Entry<K,V> e = table[bucketIndex];

table[bucketIndex] = new Entry<K,V>(hash, key, value, e);

if (size++ >= threshold)

resize(2 * table.length);

}

get方法：

調用get方法時，首先會根據傳入的key調用hashCode方法，計算hash值找到bucket位置，然后遍歷鏈表（即上面所說的linkedList<Entry<K,V>>），判斷hash和key的equals方法查找到對應的Entry對象。

public V get(Object key) {

if (key == null)

return getForNullKey();

int hash = hash(key.hashCode());

for (Entry<K,V> e = table[indexFor(hash, table.length)];

e != null;

e = e.next) {

Object k;

if (e.hash == hash && ((k = e.key) == key || key.equals(k)))

return e.value;

}

return null;

}

最佳實踐方式：

使用不可變的、聲明作final的對象，并且采用合適的equals()和hashCode()方法的話，將會減少碰撞的發生，提高效率。不可變性使得能夠緩存不同鍵的hashcode，這將提高整個獲取對象的速度，使用String，Interger這樣的wrapper類作為鍵是非常好的選擇。

參考:http://www.importnew.com/7099.html

posted on 2013-11-18 18:01 David1228 閱讀(2907) 評論(4) 編輯收藏所屬分類: JAVA

FeedBack:

# re: 源代碼分析之HashMap

2013-11-19 10:08 | 鵬達鎖業

支持博主分享回復更多評論

# re: 源代碼分析之HashMap[未登錄]

2013-11-19 11:29 | David

常來^^, 多謝支持O(∩_∩)O哈~ @鵬達鎖業
回復更多評論

# re: 源代碼分析之HashMap

2013-12-15 00:01 | 左岸

寫的挺詳細，謝謝分享回復更多評論

# re: 源代碼分析之HashMap

2014-01-08 15:54 | Alex_Woo

今天斷點調試，進入到.put方法時候，Key 和value都無法查看結果 modCount++;比如這一行，可以看到modCount的值，不曉得什么原因。想看Entry的值，也看不到.....什么原因呀？因為是泛型的原因嗎？？回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: [轉]Linux與JVM的內存關系分析 Java IO與NIO技術體系分析 Elasticsearch服務重啟故障解決過程 JAVA應用CPU占用100%\|內存泄漏分析總結 CPU利用率100%定位過程 jstack Dump 日志文件中的線程狀態 [轉] JVM調優總結 + jstat 分析 Thrift RPC框架介紹 Maven及Nexus私服搭建源代碼分析之HashMap

<

2013年11月

>

日

一

二

三

四

五

六

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

常用鏈接

留言簿(4)

隨筆分類

隨筆檔案

文章檔案

新聞分類

云計算

新聞檔案

2012年11月 (1)

相冊

收集美圖

收藏夾

Java

20非常有用的Java程序片段
20非常有用的Java程序片段
Java Map遍歷方式的選擇
Java Map遍歷方式的選擇

Linux知識相關

inux中增加swap分區文件的步驟方法
inux中增加swap分區文件的步驟方法
Spring-remoting使用心得1－RMI
Spring-remoting使用心得1－RMI
virsh管理工具
virsh管理工具

Spring相關

Restful Spring MVC
Restful Spring MVC
Spring Quartz動態配置時間
Spring Quartz動態配置時間

云計算/Linux/虛擬化技術/

CY12-Q3 OpenStack, OpenNebula，Eucalyptus，CloudStack社區活躍度比較
CY12-Q3 OpenStack, OpenNebula，Eucalyptus，CloudStack社區活躍度比較
vpsee 虛擬化技術云計算數據中心
很棒的參考學習的博客
xen FAQ
http://zhigang.org/files/docbook/xen-faq.html
中國云計算
http://www.chinacloud.cn/default.aspx
以AWS和vCloud為標桿看四大開源平臺的定位
以AWS和vCloud為標桿看四大開源平臺的定位

友情博客

Veda 原型博客交流

多線程并發編程

開源技術

ICloud云管理詳解架構
http://www.javachen.com/2011/07/opennebula-architecture/ ICloud云管理詳解架構
Java開源大全
NODEJS 服務端的javascript
http://cnodejs.org/
開源黃頁-開源博文
開源黃頁-開源博文http://yp.oss.org.cn/software/resource_page.php?cat_id=52

常用鏈接

留言簿(4)

隨筆分類

隨筆檔案

文章檔案

新聞分類

新聞檔案

相冊

收藏夾

Java

Linux知識相關

Spring相關

云計算/Linux/虛擬化技術/

友情博客

多線程并發編程

開源技術

持久層技術相關

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜