偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Java HashMap工作原理深入探討

開發(fā) 后端
大部分Java開發(fā)者都在使用Map,特別是HashMap。HashMap是一種簡單但強(qiáng)大的方式去存儲和獲取數(shù)據(jù)。但有多少開發(fā)者知道 HashMap內(nèi)部如何工作呢?幾天前,我閱讀了java.util.HashMap的大量源代碼(包括Java 7 和Java 8),來深入理解這個基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)。

大部分Java開發(fā)者都在使用Map,特別是HashMap。HashMap是一種簡單但強(qiáng)大的方式去存儲和獲取數(shù)據(jù)。但有多少開發(fā)者知道 HashMap內(nèi)部如何工作呢?幾天前,我閱讀了java.util.HashMap的大量源代碼(包括Java 7 和Java 8),來深入理解這個基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)。在這篇文章中,我會解釋java.util.HashMap的實現(xiàn),描述Java 8實現(xiàn)中添加的新特性,并討論性能、內(nèi)存以及使用HashMap時的一些已知問題。

內(nèi)部存儲

 

  1. Java HashMap類實現(xiàn)了Map<K, V>接口。這個接口中的主要方法包括: 
  2.  
  3.     V put(K key, V value) 
  4.  
  5.     V get(Object key) 
  6.  
  7.     V remove(Object key) 
  8.  
  9.     Boolean containsKey(Object key) 

HashMap使用了一個內(nèi)部類Entry<K, V>來存儲數(shù)據(jù)。這個內(nèi)部類是一個簡單的鍵值對,并帶有額外兩個數(shù)據(jù):

  • 一個指向其他入口(譯者注:引用對象)的引用,這樣HashMap可以存儲類似鏈接列表這樣的對象。

  • 一個用來代表鍵的哈希值,存儲這個值可以避免HashMap在每次需要時都重新生成鍵所對應(yīng)的哈希值。

下面是Entry<K, V>在Java 7下的一部分代碼:

  1. static class Entry<K,V> implements Map.Entry<K,V> { 
  2.         final K key; 
  3.         V value; 
  4.         Entry<K,V> next; 
  5.         int hash; 
  6. … 

HashMap將數(shù)據(jù)存儲到多個單向Entry鏈表中(有時也被稱為桶bucket或者容器orbins)。所有的列表都被注冊到一個Entry數(shù)組中(Entry<K, V>[]數(shù)組),這個內(nèi)部數(shù)組的默認(rèn)長度是16。

下面這幅圖描述了一個HashMap實例的內(nèi)部存儲,它包含一個nullable對象組成的數(shù)組。每個對象都連接到另外一個對象,這樣就構(gòu)成了一個鏈表。

所有具有相同哈希值的鍵都會被放到同一個鏈表(桶)中。具有不同哈希值的鍵最終可能會在相同的桶中。

當(dāng)用戶調(diào)用 put(K key, V value) 或者 get(Object key) 時,程序會計算對象應(yīng)該在的桶的索引。然后,程序會迭代遍歷對應(yīng)的列表,來尋找具有相同鍵的Entry對象(使用鍵的equals()方法)。

對于調(diào)用get()的情況,程序會返回值所對應(yīng)的Entry對象(如果Entry對象存在)。

對于調(diào)用put(K key, V value)的情況,如果Entry對象已經(jīng)存在,那么程序會將值替換為新值,否則,程序會在單向鏈表的表頭創(chuàng)建一個新的Entry(從參數(shù)中的鍵和值)。

桶(鏈表)的索引,是通過map的3個步驟生成的:

  • 首先獲取鍵的散列碼。

  • 程序重復(fù)散列碼,來阻止針對鍵的糟糕的哈希函數(shù),因為這有可能會將所有的數(shù)據(jù)都放到內(nèi)部數(shù)組的相同的索引(桶)上。

  • 程序拿到重復(fù)后的散列碼,并對其使用數(shù)組長度(最小是1)的位掩碼(bit-mask)。這個操作可以保證索引不會大于數(shù)組的大小。你可以將其看做是一個經(jīng)過計算的優(yōu)化取模函數(shù)。

下面是生成索引的源代碼:

  1. // the "rehash" function in JAVA 7 that takes the hashcode of the key 
  2. static int hash(int h) { 
  3.     h ^= (h >>> 20) ^ (h >>> 12); 
  4.     return h ^ (h >>> 7) ^ (h >>> 4); 
  5. // the "rehash" function in JAVA 8 that directly takes the key 
  6. static final int hash(Object key) { 
  7.     int h; 
  8.     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); 
  9.     } 
  10. // the function that returns the index from the rehashed hash 
  11. static int indexFor(int h, int length) { 
  12.     return h & (length-1); 

為了更有效地工作,內(nèi)部數(shù)組的大小必須是2的冪值。讓我們看一下為什么:

假設(shè)數(shù)組的長度是17,那么掩碼的值就是16(數(shù)組長度-1)。16的二進(jìn)制表示是0…010000,這樣對于任何值H來說,“H & 16”的結(jié)果就是16或者0。這意味著長度為17的數(shù)組只能應(yīng)用到兩個桶上:一個是0,另外一個是16,這樣不是很有效率。但是如果你將數(shù)組的長度設(shè)置為 2的冪值,例如16,那么按位索引的工作變成“H & 15”。15的二進(jìn)制表示是0…001111,索引公式輸出的值可以從0到15,這樣長度為16的數(shù)組就可以被充分使用了。例如:

  • 如果H = 952,它的二進(jìn)制表示是0..01110111000,對應(yīng)的索引是0…01000 = 8

  • 如果H = 1576,它的二進(jìn)制表示是0..011000101000,對應(yīng)的索引是0…01000 = 8

  • 如果H = 12356146,它的二進(jìn)制表示是0..0101111001000101000110010,對應(yīng)的索引是0…00010 = 2

  • 如果H = 59843,它的二進(jìn)制表示是0..01110100111000011,它對應(yīng)的索引是0…00011 = 3

這種機(jī)制對于開發(fā)者來說是透明的:如果他選擇一個長度為37的HashMap,Map會自動選擇下一個大于37的2的冪值(64)作為內(nèi)部數(shù)組的長度。

自動調(diào)整大小

在獲取索引后,get()、put()或者remove()方法會訪問對應(yīng)的鏈表,來查看針對指定鍵的Entry對象是否已經(jīng)存在。在不做修改的情 況下,這個機(jī)制可能會導(dǎo)致性能問題,因為這個方法需要迭代整個列表來查看Entry對象是否存在。假設(shè)內(nèi)部數(shù)組的長度采用默認(rèn)值16,而你需要存儲 2,000,000條記錄。在***的情況下,每個鏈表會有125,000個Entry對象(2,000,000/16)。get()、remove()和 put()方法在每一次執(zhí)行時,都需要進(jìn)行125,000次迭代。為了避免這種情況,HashMap可以增加內(nèi)部數(shù)組的長度,從而保證鏈表中只保留很少的 Entry對象。

當(dāng)你創(chuàng)建一個HashMap時,你可以通過以下構(gòu)造函數(shù)指定一個初始長度,以及一個loadFactor:

</pre>
public HashMap(int initialCapacity, float loadFactor)
<pre>

如果你不指定參數(shù),那么默認(rèn)的initialCapacity的值是16, loadFactor的默認(rèn)值是0.75。initialCapacity代表內(nèi)部數(shù)組的鏈表的長度。

當(dāng)你每次使用put(…)方法向Map中添加一個新的鍵值對時,該方法會檢查是否需要增加內(nèi)部數(shù)組的長度。為了實現(xiàn)這一點,Map存儲了2個數(shù)據(jù):

  • Map的大小:它代表HashMap中記錄的條數(shù)。我們在向HashMap中插入或者刪除值時更新它。

  • 閥值:它等于內(nèi)部數(shù)組的長度*loadFactor,在每次調(diào)整內(nèi)部數(shù)組的長度時,該閥值也會同時更新。

在添加新的Entry對象之前,put(…)方法會檢查當(dāng)前Map的大小是否大于閥值。如果大于閥值,它會創(chuàng)建一個新的數(shù)組,數(shù)組長度是當(dāng)前內(nèi)部數(shù) 組的兩倍。因為新數(shù)組的大小已經(jīng)發(fā)生改變,所以索引函數(shù)(就是返回“鍵的哈希值 & (數(shù)組長度-1)”的位運算結(jié)果)也隨之改變。調(diào)整數(shù)組的大小會創(chuàng)建兩個新的桶(鏈表),并且將所有現(xiàn)存Entry對象重新分配到桶上。調(diào)整數(shù)組大小的目 標(biāo)在于降低鏈表的大小,從而降低put()、remove()和get()方法的執(zhí)行時間。對于具有相同哈希值的鍵所對應(yīng)的所有Entry對象來說,它們 會在調(diào)整大小后分配到相同的桶中。但是,如果兩個Entry對象的鍵的哈希值不一樣,但它們之前在同一個桶上,那么在調(diào)整以后,并不能保證它們依然在同一 個桶上。

這幅圖片描述了調(diào)整前和調(diào)整后的內(nèi)部數(shù)組的情況。在調(diào)整數(shù)組長度之前,為了得到Entry對象E,Map需要迭代遍歷一個包含5個元素的鏈表。在調(diào) 整數(shù)組長度之后,同樣的get()方法則只需要遍歷一個包含2個元素的鏈表,這樣get()方法在調(diào)整數(shù)組長度后的運行速度提高了2倍。

線程安全

如果你已經(jīng)非常熟悉HashMap,那么你肯定知道它不是線程安全的,但是為什么呢?例如假設(shè)你有一個Writer線程,它只會向Map中插入已經(jīng)存在的數(shù)據(jù),一個Reader線程,它會從Map中讀取數(shù)據(jù),那么它為什么不工作呢?

因為在自動調(diào)整大小的機(jī)制下,如果線程試著去添加或者獲取一個對象,Map可能會使用舊的索引值,這樣就不會找到Entry對象所在的新桶。

在最糟糕的情況下,當(dāng)2個線程同時插入數(shù)據(jù),而2次put()調(diào)用會同時出發(fā)數(shù)組自動調(diào)整大小。既然兩個線程在同時修改鏈表,那么Map有可能在一個鏈表的內(nèi)部循環(huán)中退出。如果你試著去獲取一個帶有內(nèi)部循環(huán)的列表中的數(shù)據(jù),那么get()方法永遠(yuǎn)不會結(jié)束。

HashTable提供了一個線程安全的實現(xiàn),可以阻止上述情況發(fā)生。但是,既然所有的同步的CRUD操作都非常慢。例如,如果線程1調(diào)用 get(key1),然后線程2調(diào)用get(key2),線程2調(diào)用get(key3),那么在指定時間,只能有1個線程可以得到它的值,但是3個線程都 可以同時訪問這些數(shù)據(jù)。

從Java 5開始,我們就擁有一個更好的、保證線程安全的HashMap實現(xiàn):ConcurrentHashMap。對于ConcurrentMap來說,只有桶是 同步的,這樣如果多個線程不使用同一個桶或者調(diào)整內(nèi)部數(shù)組的大小,它們可以同時調(diào)用get()、remove()或者put()方法。在一個多線程應(yīng)用程 序中,這種方式是更好的選擇。

鍵的不變性

為什么將字符串和整數(shù)作為HashMap的鍵是一種很好的實現(xiàn)?主要是因為它們是不可變的!如果你選擇自己創(chuàng)建一個類作為鍵,但不能保證這個類是不可變的,那么你可能會在HashMap內(nèi)部丟失數(shù)據(jù)。

我們來看下面的用例:

  • 你有一個鍵,它的內(nèi)部值是“1”。

  • 你向HashMap中插入一個對象,它的鍵就是“1”。

  • HashMap從鍵(即“1”)的散列碼中生成哈希值。

  • Map在新創(chuàng)建的記錄中存儲這個哈希值。

  • 你改動鍵的內(nèi)部值,將其變?yōu)?ldquo;2”。

  • 鍵的哈希值發(fā)生了改變,但是HashMap并不知道這一點(因為存儲的是舊的哈希值)。

  • 你試著通過修改后的鍵獲取相應(yīng)的對象。

  • Map會計算新的鍵(即“2”)的哈希值,從而找到Entry對象所在的鏈表(桶)。

  • 情況1: 既然你已經(jīng)修改了鍵,Map會試著在錯誤的桶中尋找Entry對象,沒有找到。

  • 情況2: 你很幸運,修改后的鍵生成的桶和舊鍵生成的桶是同一個。Map這時會在鏈表中進(jìn)行遍歷,已找到具有相同鍵的Entry對象。但是為了尋找鍵,Map首先會 通過調(diào)用equals()方法來比較鍵的哈希值。因為修改后的鍵會生成不同的哈希值(舊的哈希值被存儲在記錄中),那么Map沒有辦法在鏈表中找到對應(yīng)的 Entry對象。

下面是一個Java示例,我們向Map中插入兩個鍵值對,然后我修改***個鍵,并試著去獲取這兩個對象。你會發(fā)現(xiàn)從Map中返回的只有第二個對象,***個對象已經(jīng)“丟失”在HashMap中:

 

  1. public class MutableKeyTest { 
  2.  
  3. public static void main(String[] args) { 
  4.  
  5.   class MyKey { 
  6.    Integer i; 
  7.  
  8.    public void setI(Integer i) { 
  9.     this.i = i; 
  10.    } 
  11.  
  12.    public MyKey(Integer i) { 
  13.     this.i = i; 
  14.    } 
  15.  
  16.    @Override 
  17.    public int hashCode() { 
  18.     return i; 
  19.    } 
  20.  
  21.    @Override 
  22.    public boolean equals(Object obj) { 
  23.     if (obj instanceof MyKey) { 
  24.      return i.equals(((MyKey) obj).i); 
  25.     } else 
  26.      return false
  27.    } 
  28.  
  29.   } 
  30.  
  31.   Map<MyKey, String> myMap = new HashMap<>(); 
  32.   MyKey key1 = new MyKey(1); 
  33.   MyKey key2 = new MyKey(2); 
  34.  
  35.   myMap.put(key1, "test " + 1); 
  36.   myMap.put(key2, "test " + 2); 
  37.  
  38.   // modifying key1 
  39.   key1.setI(3); 
  40.  
  41.   String test1 = myMap.get(key1); 
  42.   String test2 = myMap.get(key2); 
  43.  
  44.   System.out.println("test1= " + test1 + " test2=" + test2); 
  45.  
  46.  

上述代碼的輸出是“test1=null test2=test 2”。如我們期望的那樣,Map沒有能力獲取經(jīng)過修改的鍵 1所對應(yīng)的字符串1。

Java 8 中的改進(jìn)

在Java 8中,HashMap中的內(nèi)部實現(xiàn)進(jìn)行了很多修改。的確如此,Java 7使用了1000行代碼來實現(xiàn),而Java 8中使用了2000行代碼。我在前面描述的大部分內(nèi)容在Java 8中依然是對的,除了使用鏈表來保存Entry對象。在Java 8中,我們?nèi)匀皇褂脭?shù)組,但它會被保存在Node中,Node中包含了和之前Entry對象一樣的信息,并且也會使用鏈表:

下面是在Java 8中Node實現(xiàn)的一部分代碼:

  1. static class Node<K,V> implements Map.Entry<K,V> { 
  2.      final int hash; 
  3.      final K key; 
  4.      V value; 
  5.      Node<K,V> next; 

那么和Java 7相比,到底有什么大的區(qū)別呢?好吧,Node可以被擴(kuò)展成TreeNode。TreeNode是一個紅黑樹的數(shù)據(jù)結(jié)構(gòu),它可以存儲更多的信息,這樣我們 可以在O(log(n))的復(fù)雜度下添加、刪除或者獲取一個元素。下面的示例描述了TreeNode保存的所有信息:

  1. static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> { 
  2. final int hash; // inherited from Node<K,V> 
  3. final K key; // inherited from Node<K,V> 
  4. V value; // inherited from Node<K,V> 
  5. Node<K,V> next; // inherited from Node<K,V> 
  6. Entry<K,V> before, after;// inherited from LinkedHashMap.Entry<K,V> 
  7. TreeNode<K,V> parent; 
  8. TreeNode<K,V> left; 
  9. TreeNode<K,V> right; 
  10. TreeNode<K,V> prev; 
  11. boolean red; 

紅黑樹是自平衡的二叉搜索樹。它的內(nèi)部機(jī)制可以保證它的長度總是log(n),不管我們是添加還是刪除節(jié)點。使用這種類型的樹,最主要的好處是針對 內(nèi)部表中許多數(shù)據(jù)都具有相同索引(桶)的情況,這時對樹進(jìn)行搜索的復(fù)雜度是O(log(n)),而對于鏈表來說,執(zhí)行相同的操作,復(fù)雜度是O(n)。

如你所見,我們在樹中確實存儲了比鏈表更多的數(shù)據(jù)。根據(jù)繼承原則,內(nèi)部表中可以包含Node(鏈表)或者TreeNode(紅黑樹)。Oracle決定根據(jù)下面的規(guī)則來使用這兩種數(shù)據(jù)結(jié)構(gòu):

- 對于內(nèi)部表中的指定索引(桶),如果node的數(shù)目多于8個,那么鏈表就會被轉(zhuǎn)換成紅黑樹。

- 對于內(nèi)部表中的指定索引(桶),如果node的數(shù)目小于6個,那么紅黑樹就會被轉(zhuǎn)換成鏈表。

這張圖片描述了在Java 8 HashMap中的內(nèi)部數(shù)組,它既包含樹(桶0),也包含鏈表(桶1,2和3)。桶0是一個樹結(jié)構(gòu)是因為它包含的節(jié)點大于8個。

內(nèi)存開銷

JAVA 7

使用HashMap會消耗一些內(nèi)存。在Java 7中,HashMap將鍵值對封裝成Entry對象,一個Entry對象包含以下信息:

  • 指向下一個記錄的引用

  • 一個預(yù)先計算的哈希值(整數(shù))

  • 一個指向鍵的引用

  • 一個指向值的引用

此外,Java 7中的HashMap使用了Entry對象的內(nèi)部數(shù)組。假設(shè)一個Java 7 HashMap包含N個元素,它的內(nèi)部數(shù)組的容量是CAPACITY,那么額外的內(nèi)存消耗大約是:

sizeOf(integer)* N + sizeOf(reference)* (3*N+C)

其中:

  • 整數(shù)的大小是4個字節(jié)

  • 引用的大小依賴于JVM、操作系統(tǒng)以及處理器,但通常都是4個字節(jié)。

這就意味著內(nèi)存總開銷通常是16 * N + 4 * CAPACITY字節(jié)。

注意:在Map自動調(diào)整大小后,CAPACITY的值是下一個大于N的最小的2的冪值。

注意:從Java 7開始,HashMap采用了延遲加載的機(jī)制。這意味著即使你為HashMap指定了大小,在我們***次使用put()方法之前,記錄使用的內(nèi)部數(shù)組(耗費4*CAPACITY字節(jié))也不會在內(nèi)存中分配空間。

JAVA 8

在Java 8實現(xiàn)中,計算內(nèi)存使用情況變得復(fù)雜一些,因為Node可能會和Entry存儲相同的數(shù)據(jù),或者在此基礎(chǔ)上再增加6個引用和一個Boolean屬性(指定是否是TreeNode)。

如果所有的節(jié)點都只是Node,那么Java 8 HashMap消耗的內(nèi)存和Java 7 HashMap消耗的內(nèi)存是一樣的。

如果所有的節(jié)點都是TreeNode,那么Java 8 HashMap消耗的內(nèi)存就變成:

N * sizeOf(integer) + N * sizeOf(boolean) + sizeOf(reference)* (9*N+CAPACITY )

在大部分標(biāo)準(zhǔn)JVM中,上述公式的結(jié)果是44 * N + 4 * CAPACITY 字節(jié)。

性能問題

非對稱HashMap vs 均衡HashMap

在***的情況下,get()和put()方法都只有O(1)的復(fù)雜度。但是,如果你不去關(guān)心鍵的哈希函數(shù),那么你的put()和get()方法可能 會執(zhí)行非常慢。put()和get()方法的高效執(zhí)行,取決于數(shù)據(jù)被分配到內(nèi)部數(shù)組(桶)的不同的索引上。如果鍵的哈希函數(shù)設(shè)計不合理,你會得到一個非對 稱的分區(qū)(不管內(nèi)部數(shù)據(jù)的是多大)。所有的put()和get()方法會使用***的鏈表,這樣就會執(zhí)行很慢,因為它需要迭代鏈表中的全部記錄。在最壞的情 況下(如果大部分?jǐn)?shù)據(jù)都在同一個桶上),那么你的時間復(fù)雜度就會變?yōu)镺(n)。

下面是一個可視化的示例。***張圖描述了一個非對稱HashMap,第二張圖描述了一個均衡HashMap。

在這個非對稱HashMap中,在桶0上運行g(shù)et()和put()方法會很花費時間。獲取記錄K需要花費6次迭代。

在這個均衡HashMap中,獲取記錄K只需要花費3次迭代。這兩個HashMap存儲了相同數(shù)量的數(shù)據(jù),并且內(nèi)部數(shù)組的大小一樣。唯一的區(qū)別是鍵的哈希函數(shù),這個函數(shù)用來將記錄分布到不同的桶上。

下面是一個使用Java編寫的極端示例,在這個示例中,我使用哈希函數(shù)將所有的數(shù)據(jù)放到相同的鏈表(桶),然后我添加了2,000,000條數(shù)據(jù)。

  1. public class Test { 
  2.  
  3. public static void main(String[] args) { 
  4.  
  5.   class MyKey { 
  6.    Integer i; 
  7.    public MyKey(Integer i){ 
  8.     this.i =i; 
  9.    } 
  10.  
  11.    @Override 
  12.    public int hashCode() { 
  13.     return 1
  14.    } 
  15.  
  16.    @Override 
  17.    public boolean equals(Object obj) { 
  18.    … 
  19.    } 
  20.  
  21.   } 
  22.   Date begin = new Date(); 
  23.   Map <MyKey,String> myMap= new HashMap<>(2_500_000,1); 
  24.   for (int i=0;i<2_000_000;i++){ 
  25.    myMap.put( new MyKey(i), "test "+i); 
  26.   } 
  27.  
  28.   Date end = new Date(); 
  29.   System.out.println("Duration (ms) "+ (end.getTime()-begin.getTime())); 

我的機(jī)器配置是core i5-2500k @ 3.6G,在java 8u40下需要花費超過45分鐘的時間來運行(我在45分鐘后停止了進(jìn)程)。如果我運行同樣的代碼, 但是我使用如下的hash函數(shù):

  1.  @Override 
  2. public int hashCode() { 
  3.   int key = 2097152-1
  4.   return key+2097152*i; 

運行它需要花費46秒,和之前比,這種方式好很多了!新的hash函數(shù)比舊的hash函數(shù)在處理哈希分區(qū)時更合理,因此調(diào)用put()方法會更快一些。如果你現(xiàn)在運行相同的代碼,但是使用下面的hash函數(shù),它提供了更好的哈希分區(qū):

  1.  @Override 
  2. public int hashCode() { 
  3. return i; 

現(xiàn)在只需要花費2秒!

我希望你能夠意識到哈希函數(shù)有多重要。如果在Java 7上面運行同樣的測試,***個和第二個的情況會更糟(因為Java 7中的put()方法復(fù)雜度是O(n),而Java 8中的復(fù)雜度是O(log(n))。

在使用HashMap時,你需要針對鍵找到一種哈希函數(shù),可以將鍵擴(kuò)散到最可能的桶上。為此,你需要避免哈希沖突。String對象是一個非常好的鍵,因為它有很好的哈希函數(shù)。Integer也很好,因為它的哈希值就是它自身的值。

調(diào)整大小的開銷

如果你需要存儲大量數(shù)據(jù),你應(yīng)該在創(chuàng)建HashMap時指定一個初始的容量,這個容量應(yīng)該接近你期望的大小。

如果你不這樣做,Map會使用默認(rèn)的大小,即16,factorLoad的值是0.75。前11次調(diào)用put()方法會非???,但是第12次 (16*0.75)調(diào)用時會創(chuàng)建一個新的長度為32的內(nèi)部數(shù)組(以及對應(yīng)的鏈表/樹),第13次到第22次調(diào)用put()方法會很快,但是第23次 (32*0.75)調(diào)用時會重新創(chuàng)建(再一次)一個新的內(nèi)部數(shù)組,數(shù)組的長度翻倍。然后內(nèi)部調(diào)整大小的操作會在第48次、96次、192次…..調(diào)用 put()方法時觸發(fā)。如果數(shù)據(jù)量不大,重建內(nèi)部數(shù)組的操作會很快,但是數(shù)據(jù)量很大時,花費的時間可能會從秒級到分鐘級。通過初始化時指定Map期望的大 小,你可以避免調(diào)整大小操作帶來的消耗。

但這里也有一個缺點:如果你將數(shù)組設(shè)置的非常大,例如2^28,但你只是用了數(shù)組中的2^26個桶,那么你將會浪費大量的內(nèi)存(在這個示例中大約是2^30字節(jié))。

結(jié)論

對于簡單的用例,你沒有必要知道HashMap是如何工作的,因為你不會看到O(1)、O(n)以及O(log(n))之間的區(qū)別。但是如果能夠理解這一經(jīng)常使用的數(shù)據(jù)結(jié)構(gòu)背后的機(jī)制,總是有好處的。另外,對于Java開發(fā)者職位來說,這是一道典型的面試問題。

對于大數(shù)據(jù)量的情況,了解HashMap如何工作以及理解鍵的哈希函數(shù)的重要性就變得非常重要。

我希望這篇文章可以幫助你對HashMap的實現(xiàn)有一個深入的理解。

責(zé)任編輯:王雪燕 來源: ImportNew
相關(guān)推薦

2009-10-16 09:17:39

屏蔽布線系統(tǒng)

2009-12-11 11:08:31

靜態(tài)路由策略

2010-11-04 10:25:31

DB2表連接

2009-12-23 16:13:00

WPF Attache

2011-02-25 09:23:00

Java類加載器

2010-11-22 14:18:32

MySQL鎖機(jī)制

2010-07-21 09:38:15

PHP緩存技術(shù)

2009-11-20 17:17:08

Oracle函數(shù)索引

2021-05-17 05:36:02

CSS 文字動畫技巧

2009-06-16 10:51:14

Java源碼

2010-03-05 13:44:00

Python序列

2023-01-12 17:18:06

數(shù)據(jù)庫多云

2010-03-31 14:58:03

云計算

2009-08-27 11:27:58

foreach語句C# foreach語

2009-12-07 13:55:58

PHP array_m

2009-11-12 13:56:54

2009-12-07 16:07:03

PHP類的繼承

2024-01-26 06:42:05

Redis數(shù)據(jù)結(jié)構(gòu)

2012-02-28 14:43:43

2009-12-14 14:40:10

Ruby全局域變量
點贊
收藏

51CTO技術(shù)棧公眾號