現(xiàn)在是晚上11點(diǎn)了,學(xué)校屠豬館的自習(xí)室因?yàn)樘硪P(guān)閉了。勤奮且疲憊的小魯班也從屠豬館出來(lái)了,正準(zhǔn)備回宿舍洗洗睡,由于自習(xí)室位置比較偏僻所以是接收不到手機(jī)網(wǎng)絡(luò)信號(hào)的,因此小魯班從兜里掏出手機(jī)的時(shí)候,信息可真是炸了呀。小魯班心想,微信群平時(shí)都沒(méi)什么人聊天,今晚肯定是發(fā)生了什么大事。仔細(xì)一看,才發(fā)現(xiàn)原來(lái)是小魯班的室友達(dá)摩(光頭)拿到了阿里巴巴 Java 開(kāi)發(fā)實(shí)習(xí)生的 Offer,此時(shí)小魯班真替他室友感到高興的同時(shí),心里也難免會(huì)產(chǎn)生一絲絲的失落感,那是因?yàn)樽约和读撕芏喾莺?jiǎn)歷,別說(shuō)拿不拿得到 Offer,就連給面試邀的公司也都寥寥無(wú)幾。小魯班這會(huì)可真是受到了一萬(wàn)點(diǎn)真實(shí)暴擊。不過(guò)小魯班還是很樂(lè)觀的,很快調(diào)整了心態(tài),帶上耳機(jī),慢慢的走回了宿舍,正打算準(zhǔn)備向他那神室友達(dá)摩取取經(jīng)。 片刻后~ 小魯班:666,聽(tīng)說(shuō)你拿到了阿里的 Offer,能透露一下面試內(nèi)容和技巧嗎?
無(wú)窮無(wú)盡深入,直到你回答不出來(lái)或者面試官認(rèn)為問(wèn)題到底了。 小魯班捏了一把汗,我去……這是魔鬼吧,那我們來(lái)試試唄(因?yàn)樾◆敯鄤倓傇谧粤?xí)室才看了這章的知識(shí),想趁機(jī)裝一波逼,畢竟剛剛叫了聲爸爸~~) 于是達(dá)摩 and 小魯班就開(kāi)始了對(duì)決: 1、為什么用HashMap?
2、HashMap 的工作原理是什么?HashMap 是基于 hashing 的原理我們使用 put(key, value) 存儲(chǔ)對(duì)象到 HashMap 中,使用 get(key) 從 HashMap 中獲取對(duì)象。當(dāng)我們給 put() 方法傳遞鍵和值時(shí),我們先對(duì)鍵調(diào)用 hashCode() 方法,計(jì)算并返回的 hashCode 是用于找到 Map 數(shù)組的 bucket 位置來(lái)儲(chǔ)存 Node 對(duì)象。 這里關(guān)鍵點(diǎn)在于指出,HashMap 是在 bucket 中儲(chǔ)存鍵對(duì)象和值對(duì)象,作為Map.Node 。 以下是 HashMap 初始化簡(jiǎn)化的模擬數(shù)據(jù)結(jié)構(gòu): Node[] table = new Node[16]; // 散列桶初始化,table 以下是具體的 put 過(guò)程(JDK1.8)
以下是具體 get 過(guò)程考慮特殊情況:如果兩個(gè)鍵的 hashcode 相同,你如何獲取值對(duì)象? 當(dāng)我們調(diào)用 get() 方法,HashMap 會(huì)使用鍵對(duì)象的 hashcode 找到 bucket 位置,找到 bucket 位置之后,會(huì)調(diào)用 keys.equals() 方法去找到鏈表中正確的節(jié)點(diǎn),最終找到要找的值對(duì)象。 3、有什么方法可以減少碰撞?擾動(dòng)函數(shù)可以減少碰撞原理是如果兩個(gè)不相等的對(duì)象返回不同的 hashcode 的話,那么碰撞的幾率就會(huì)小些。這就意味著存鏈表結(jié)構(gòu)減小,這樣取值的話就不會(huì)頻繁調(diào)用 equal 方法,從而提高 HashMap 的性能(擾動(dòng)即 Hash 方法內(nèi)部的算法實(shí)現(xiàn),目的是讓不同對(duì)象返回不同 hashcode)。 使用不可變的、聲明作 final 對(duì)象,并且采用合適的 equals() 和 hashCode() 方法,將會(huì)減少碰撞的發(fā)生不可變性使得能夠緩存不同鍵的 hashcode,這將提高整個(gè)獲取對(duì)象的速度,使用 String、Integer 這樣的 wrapper 類(lèi)作為鍵是非常好的選擇。 為什么 String、Integer 這樣的 wrapper 類(lèi)適合作為鍵?因?yàn)?String 是 final,而且已經(jīng)重寫(xiě)了 equals() 和 hashCode() 方法了。不可變性是必要的,因?yàn)闉榱艘?jì)算 hashCode(),就要防止鍵值改變,如果鍵值在放入時(shí)和獲取時(shí)返回不同的 hashcode 的話,那么就不能從 HashMap 中找到你想要的對(duì)象。 4、HashMap 中 hash 函數(shù)怎么是實(shí)現(xiàn)的?我們可以看到,在 hashmap 中要找到某個(gè)元素,需要根據(jù) key 的 hash 值來(lái)求得對(duì)應(yīng)數(shù)組中的位置。如何計(jì)算這個(gè)位置就是 hash 算法。 前面說(shuō)過(guò),hashmap 的數(shù)據(jù)結(jié)構(gòu)是數(shù)組和鏈表的結(jié)合,所以我們當(dāng)然希望這個(gè) hashmap 里面的元素位置盡量的分布均勻些,盡量使得每個(gè)位置上的元素?cái)?shù)量只有一個(gè)。那么當(dāng)我們用 hash 算法求得這個(gè)位置的時(shí)候,馬上就可以知道對(duì)應(yīng)位置的元素就是我們要的,而不用再去遍歷鏈表。 所以,我們首先想到的就是把 hashcode 對(duì)數(shù)組長(zhǎng)度取模運(yùn)算。這樣一來(lái),元素的分布相對(duì)來(lái)說(shuō)是比較均勻的。 但是“?!边\(yùn)算的消耗還是比較大的,能不能找一種更快速、消耗更小的方式?我們來(lái)看看 JDK1.8 源碼是怎么做的(被樓主修飾了一下)
簡(jiǎn)單來(lái)說(shuō)就是:
5、拉鏈法導(dǎo)致的鏈表過(guò)深,為什么不用二叉查找樹(shù)代替而選擇紅黑樹(shù)?為什么不一直使用紅黑樹(shù)?之所以選擇紅黑樹(shù)是為了解決二叉查找樹(shù)的缺陷:二叉查找樹(shù)在特殊情況下會(huì)變成一條線性結(jié)構(gòu)(這就跟原來(lái)使用鏈表結(jié)構(gòu)一樣了,造成層次很深的問(wèn)題),遍歷查找會(huì)非常慢。而紅黑樹(shù)在插入新數(shù)據(jù)后可能需要通過(guò)左旋、右旋、變色這些操作來(lái)保持平衡。引入紅黑樹(shù)就是為了查找數(shù)據(jù)快,解決鏈表查詢(xún)深度的問(wèn)題。我們知道紅黑樹(shù)屬于平衡二叉樹(shù),為了保持“平衡”是需要付出代價(jià)的,但是該代價(jià)所損耗的資源要比遍歷線性鏈表要少。所以當(dāng)長(zhǎng)度大于8的時(shí)候,會(huì)使用紅黑樹(shù);如果鏈表長(zhǎng)度很短的話,根本不需要引入紅黑樹(shù),引入反而會(huì)慢。 6、說(shuō)說(shuō)你對(duì)紅黑樹(shù)的見(jiàn)解?
7、解決 hash 碰撞還有那些辦法?開(kāi)放定址法當(dāng)沖突發(fā)生時(shí),使用某種探查技術(shù)在散列表中形成一個(gè)探查(測(cè))序列。沿此序列逐個(gè)單元地查找,直到找到給定的地址。按照形成探查序列的方法不同,可將開(kāi)放定址法區(qū)分為線性探查法、二次探查法、雙重散列法等。 下面給一個(gè)線性探查法的例子: 問(wèn)題:已知一組關(guān)鍵字為 (26,36,41,38,44,15,68,12,06,51),用除余法構(gòu)造散列函數(shù),用線性探查法解決沖突構(gòu)造這組關(guān)鍵字的散列表。 8、如果 HashMap 的大小超過(guò)了負(fù)載因子(load factor)定義的容量怎么辦?HashMap 默認(rèn)的負(fù)載因子大小為0.75。也就是說(shuō),當(dāng)一個(gè) Map 填滿了75%的 bucket 時(shí)候,和其它集合類(lèi)一樣(如 ArrayList 等),將會(huì)創(chuàng)建原來(lái) HashMap 大小的兩倍的 bucket 數(shù)組來(lái)重新調(diào)整 Map 大小,并將原來(lái)的對(duì)象放入新的 bucket 數(shù)組中。這個(gè)過(guò)程叫作 rehashing。 因?yàn)樗{(diào)用 hash 方法找到新的 bucket 位置。這個(gè)值只可能在兩個(gè)地方,一個(gè)是原下標(biāo)的位置,另一種是在下標(biāo)為 <原下標(biāo) 原容量> 的位置。 9、重新調(diào)整 HashMap 大小存在什么問(wèn)題嗎?重新調(diào)整 HashMap 大小的時(shí)候,確實(shí)存在條件競(jìng)爭(zhēng)。 因?yàn)槿绻麅蓚€(gè)線程都發(fā)現(xiàn) HashMap 需要重新調(diào)整大小了,它們會(huì)同時(shí)試著調(diào)整大小。在調(diào)整大小的過(guò)程中,存儲(chǔ)在鏈表中的元素的次序會(huì)反過(guò)來(lái)。因?yàn)橐苿?dòng)到新的 bucket 位置的時(shí)候,HashMap 并不會(huì)將元素放在鏈表的尾部,而是放在頭部。這是為了避免尾部遍歷(tail traversing)。如果條件競(jìng)爭(zhēng)發(fā)生了,那么就死循環(huán)了。多線程的環(huán)境下不使用 HashMap。 為什么多線程會(huì)導(dǎo)致死循環(huán),它是怎么發(fā)生的?HashMap 的容量是有限的。當(dāng)經(jīng)過(guò)多次元素插入,使得 HashMap 達(dá)到一定飽和度時(shí),Key 映射位置發(fā)生沖突的幾率會(huì)逐漸提高。這時(shí)候, HashMap 需要擴(kuò)展它的長(zhǎng)度,也就是進(jìn)行Resize。
(這個(gè)過(guò)程比較燒腦,暫不作流程圖演示,有興趣去看看我的另一篇博文“HashMap擴(kuò)容全過(guò)程”) 達(dá)摩:哎呦,小老弟不錯(cuò)嘛~~意料之外呀 10、HashTable
11、HashMap 與 HashTable 區(qū)別
12、可以使用 CocurrentHashMap 來(lái)代替 Hashtable 嗎?
13、CocurrentHashMap(JDK 1.7)
首先第一步的時(shí)候會(huì)嘗試獲取鎖,如果獲取失敗肯定就有其他線程存在競(jìng)爭(zhēng),則利用 scanAndLockForPut() 自旋獲取鎖
14、CocurrentHashMap(JDK 1.8)CocurrentHashMap 拋棄了原有的 Segment 分段鎖,采用了 CAS synchronized 來(lái)保證并發(fā)安全性。其中的 val next 都用了 volatile 修飾,保證了可見(jiàn)性。 最大特點(diǎn)是引入了 CAS借助 Unsafe 來(lái)實(shí)現(xiàn) native code。CAS有3個(gè)操作數(shù),內(nèi)存值 V、舊的預(yù)期值 A、要修改的新值 B。當(dāng)且僅當(dāng)預(yù)期值 A 和內(nèi)存值 V 相同時(shí),將內(nèi)存值V修改為 B,否則什么都不做。Unsafe 借助 CPU 指令 cmpxchg 來(lái)實(shí)現(xiàn)。 CAS 使用實(shí)例對(duì) sizeCtl 的控制都是用 CAS 來(lái)實(shí)現(xiàn)的:
CAS 會(huì)出現(xiàn)的問(wèn)題:ABA解決:對(duì)變量增加一個(gè)版本號(hào),每次修改,版本號(hào)加 1,比較的時(shí)候比較版本號(hào)。 put 過(guò)程
get 過(guò)程
此時(shí)躺著床上的張飛哄了一聲:睡覺(jué)了睡覺(jué)了~ 見(jiàn)此不太妙:小魯班立馬回到床上把被子蓋過(guò)頭,心里有一絲絲愉悅感。不對(duì),好像還沒(méi)洗澡…… by the way ConcurrentHashMap 在 Java 8 中存在一個(gè) bug 會(huì)進(jìn)入死循環(huán),原因是遞歸創(chuàng)建 ConcurrentHashMap 對(duì)象,但是在 JDK 1.9 已經(jīng)修復(fù)了。場(chǎng)景重現(xiàn)如下: public class ConcurrentHashMapDemo{ |
|
來(lái)自: liang1234_ > 《源碼》