回復(fù)“000”獲取大量電子書 寫在前面在面試中,,HashMap基本必問,只是問法各有不同而已,。曾經(jīng)我也和很多面試官聊過關(guān)于HashMap的話題,使用HashMap就能考察面試者的很多知識點,。不幸的是,很大部分人都拜倒在HashMap的石榴裙底下,。 HashMap為什么如此受面試官青睞? 我覺得其中有4個原因:
下面就是我給大家準(zhǔn)備的HashMap連環(huán)炮,這個連環(huán)炮就相當(dāng)于高考真題演練一樣,,可能沒有完全一樣的,,只是問法不同罷了,這個主要得益于咱們漢語博大精深,。 下面是HashMap的25連環(huán)炮: 1:說說HashMap 底層數(shù)據(jù)結(jié)構(gòu)是怎樣的,? 2:談一下HashMap的特性? 3:使用HashMap時,,當(dāng)兩個對象的 hashCode 相同怎么辦,? 4:HashMap 的哈希函數(shù)怎么設(shè)計的嗎,? 5:HashMap遍歷方法有幾種,? 6:為什么采用 hashcode 的高 16 位和低 16 位異或能降低 hash 碰撞?hash 函數(shù)能不能直接用 key 的 hashcode,? 7:解決hash沖突的有幾種方法,? 8:為什么要用異或運算符,? 9.:HashMap 的 table 的容量如何確定? 10:請解釋一下HashMap的參數(shù)loadFactor,,它的作用是什么 11:說說HashMap中put方法的過程 12:當(dāng)鏈表長度 >= 8時,,為什么要將鏈表轉(zhuǎn)換成紅黑樹? 13:new HashMap(18);此時HashMap初始容量為多少? 14:說說resize擴容的過程 15:說說hashMap中g(shù)et是如何實現(xiàn)的,? 16:拉鏈法導(dǎo)致的鏈表過深問題為什么不用二叉查找樹代替,,而選擇紅黑樹?為什么不一直使用紅黑樹,? 17:說說你對紅黑樹的了解 18:JDK8中對HashMap做了哪些改變,? 19:HashMap 中的 key 我們可以使用任何類作為 key 嗎? 20:HashMap 的長度為什么是 2 的 N 次方呢,? 21:HashMap,,LinkedHashMap,TreeMap 有什么區(qū)別,? 22:說說什么是 fail-fast,? 23:HashMap 和 HashTable 有什么區(qū)別? 24:HashMap 是線程安全的嗎,? 25:如何規(guī)避 HashMap 的線程不安全,? 26:HashMap 和 ConcurrentHashMap 的區(qū)別? 27:為什么 ConcurrentHashMap 比 HashTable 效率要高,? 28:說說 ConcurrentHashMap中 鎖機制 29:在 JDK 1.8 中,,ConcurrentHashMap 為什么要使用內(nèi)置鎖 synchronized 來代替重入鎖 ReentrantLock? 30:能對ConcurrentHashMap 做個簡單介紹嗎,? 31:熟悉ConcurrentHashMap 的并發(fā)度嗎,? .... java集合知識總結(jié)(需要思維導(dǎo)圖的,請加我微信tj20120622,,免費贈予) 下面我們正式開始連環(huán)炮 1,、說說HashMap 底層數(shù)據(jù)結(jié)構(gòu)是怎樣的?HashMap 底層是 hash 數(shù)組和單向鏈表實現(xiàn),,jdk8后采用數(shù)組+鏈表+紅黑樹的數(shù)據(jù)結(jié)構(gòu),。 2、說說HashMap 的工作原理
HashMap 底層是 hash 數(shù)組和單向鏈表實現(xiàn),,JDK8后采用數(shù)組+鏈表+紅黑樹的數(shù)據(jù)結(jié)構(gòu),。 我們通過put和get存儲和獲取對象。當(dāng)我們給put()方法傳遞鍵和值時,,先對鍵做一個hashCode()的計算來得到它在bucket數(shù)組中的位置來存儲Entry對象,。當(dāng)獲取對象時,通過get獲取到bucket的位置,,再通過鍵對象的equals()方法找到正確的鍵值對,,然后在返回值對象,。 3、使用HashMap時,,當(dāng)兩個對象的 hashCode 相同怎么辦,?因為HashCode 相同,不一定就是相等的(equals方法比較),,所以兩個對象所在數(shù)組的下標(biāo)相同,,"碰撞"就此發(fā)生。又因為 HashMap 使用鏈表存儲對象,,這個 Node 會存儲到鏈表中,。 4、HashMap 的哈希函數(shù)怎么設(shè)計的嗎,?hash 函數(shù)是先拿到通過 key 的 hashCode ,,是 32 位的 int 值,然后讓 hashCode 的高 16 位和低 16 位進行異或操作,。兩個好處:
5,、HashMap遍歷方法有幾種,?
6,、為什么采用 hashcode 的高 16 位和低 16 位異或能降低 hash 碰撞?因為 key.hashCode()函數(shù)調(diào)用的是 key 鍵值類型自帶的哈希函數(shù),,返回 int 型散列值,。int 值范圍為**-2147483648~2147483647**,前后加起來大概 40 億的映射空間,。只要哈希函數(shù)映射得比較均勻松散,,一般應(yīng)用是很難出現(xiàn)碰撞的。但問題是一個 40 億長度的數(shù)組,,內(nèi)存是放不下的,。 設(shè)想,如果 HashMap 數(shù)組的初始大小才 16,,用之前需要對數(shù)組的長度取模運算,,得到的余數(shù)才能用來訪問數(shù)組下標(biāo)。 7,、解決hash沖突的有幾種方法,?
8,、為什么要用異或運算符,?保證了對象的 hashCode 的 32 位值只要有一位發(fā)生改變,,整個 hash() 返回值就會改變。盡可能的減少碰撞,。 9,、HashMap 的 table 的容量如何確定?①,、table 數(shù)組大小是由 capacity 這個參數(shù)確定的,,默認是16,也可以構(gòu)造時傳入,,最大限制是1<<30,; ②、loadFactor 是裝載因子,,主要目的是用來確認table 數(shù)組是否需要動態(tài)擴展,,默認值是0.75,比如table 數(shù)組大小為 16,,裝載因子為 0.75 時,,threshold 就是12,當(dāng) table 的實際大小超過 12 時,,table就需要動態(tài)擴容,; ③、擴容時,,調(diào)用 resize() 方法,將 table 長度變?yōu)樵瓉淼膬杀叮ㄗ⒁馐?table 長度,,而不是 threshold),; ④、如果數(shù)據(jù)很大的情況下,,擴展時將會帶來性能的損失,,在性能要求很高的地方,這種損失很可能很致命,。 10,、請解釋一下HashMap的參數(shù)loadFactor,它的作用是什么loadFactor表示HashMap的擁擠程度,,影響hash操作到同一個數(shù)組位置的概率,。 默認loadFactor等于0.75,當(dāng)HashMap里面容納的元素已經(jīng)達到HashMap數(shù)組長度的75%時,,表示HashMap太擠了,,需要擴容,在HashMap的構(gòu)造器中可以定制loadFactor,。 11,、說說HashMap中put方法的過程由于JDK版本中HashMap設(shè)計上存在差異,,這里說說JDK7和JDK8中的區(qū)別: 具體put流程,請參照下圖進行回答: 12,、當(dāng)鏈表長度 >= 8時,,為什么要將鏈表轉(zhuǎn)換成紅黑樹?因為紅黑樹的平均查找長度是log(n),,長度為8的時候,,平均查找長度為3,如果繼續(xù)使用鏈表,,平均查找長度為8/2=4,,所以,當(dāng)鏈表長度 >= 8時 ,,有必要將鏈表轉(zhuǎn)換成紅黑樹,。 13、new HashMap(18);此時HashMap初始容量為多少,?容量為32,。 在HashMap中有個靜態(tài)方法tableSizeFor ,tableSizeFor方法保證函數(shù)返回值是大于等于給定參數(shù)initialCapacity最小的2的冪次方的數(shù)值 ,。 static final int tableSizeFor(int cap) { 14,、說說resize擴容的過程創(chuàng)建一個新的數(shù)組,其容量為舊數(shù)組的兩倍,,并重新計算舊數(shù)組中結(jié)點的存儲位置,。結(jié)點在新數(shù)組中的位置只有兩種,原下標(biāo)位置或原下標(biāo)+舊數(shù)組的大小,。 15,、說說hashMap中g(shù)et是如何實現(xiàn)的?對key的hashCode進行hash值計算,,與運算計算下標(biāo)獲取bucket位置,,如果在桶的首位上就可以找到就直接返回,否則在樹中找或者鏈表中遍歷找,,如果有hash沖突,,則利用equals方法去遍歷鏈表查找節(jié)點。 16,、拉鏈法導(dǎo)致的鏈表過深問題為什么不用二叉查找樹代替,,而選擇紅黑樹?為什么不一直使用紅黑樹,?之所以選擇紅黑樹是為了解決二叉查找樹的缺陷,,二叉查找樹在特殊情況下會變成一條線性結(jié)構(gòu)(這就跟原來使用鏈表結(jié)構(gòu)一樣了,造成很深的問題),,遍歷查找會非常慢,。而紅黑樹在插入新數(shù)據(jù)后可能需要通過左旋,,右旋、變色這些操作來保持平衡,,引入紅黑樹就是為了查找數(shù)據(jù)快,,解決鏈表查詢深度的問題,我們知道紅黑樹屬于平衡二叉樹,,但是為了保持“平衡”是需要付出代價的,,但是該代價所損耗的資源要比遍歷線性鏈表要少,所以當(dāng)長度大于8的時候,,會使用紅黑樹,,如果鏈表長度很短的話,根本不需要引入紅黑樹,,引入反而會慢,。 17、說說你對紅黑樹的了解紅黑樹是一種自平衡的二叉查找樹,,是一種高效的查找樹,。 紅黑樹通過如下的性質(zhì)定義實現(xiàn)自平衡:
18、JDK8中對HashMap做了哪些改變,?1.在java 1.8中,,如果鏈表的長度超過了8,那么鏈表將轉(zhuǎn)換為紅黑樹,。(桶的數(shù)量必須大于64,,小于64的時候只會擴容) 2.發(fā)生hash碰撞時,,java 1.7 會在鏈表的頭部插入,,而java 1.8會在鏈表的尾部插入 3.在java 1.8中,Entry被Node替代(換了一個馬甲),。 19,、HashMap 中的 key 我們可以使用任何類作為 key 嗎?平時可能大家使用的最多的就是使用 String 作為 HashMap 的 key,,但是現(xiàn)在我們想使用某個自定 義類作為 HashMap 的 key,,那就需要注意以下幾點:
20,、HashMap 的長度為什么是 2 的 N 次方呢,?為了能讓 HashMap 存數(shù)據(jù)和取數(shù)據(jù)的效率高,盡可能地減少 hash 值的碰撞,,也就是說盡量把數(shù) 據(jù)能均勻的分配,,每個鏈表或者紅黑樹長度盡量相等。我們首先可能會想到 % 取模的操作來實現(xiàn),。下面是回答的重點喲:
這就是為什么 HashMap 的長度需要 2 的 N 次方了,。 21,、HashMap,LinkedHashMap,,TreeMap 有什么區(qū)別,?
22、說說什么是 fail-fast,?fail-fast 機制是 Java 集合(Collection)中的一種錯誤機制,。當(dāng)多個線程對同一個集合的內(nèi)容進行 操作時,,就可能會產(chǎn)生 fail-fast 事件。 例如:當(dāng)某一個線程 A 通過 iterator 去遍歷某集合的過程中,,若該集合的內(nèi)容被其他線程所改變 了,,那么線程 A 訪問集合時,就會拋出 ConcurrentModificationException 異常,,產(chǎn)生 fail-fast 事 件,。這里的操作主要是指 add、remove 和 clear,,對集合元素個數(shù)進行修改,。 解決辦法 建議使用“java.util.concurrent 包下的類”去取代“java.util 包下的類”??梢赃@么理解:在遍歷之前,,把 modCount 記下來 expectModCount,后面 expectModCount 去 和 modCount 進行比較,,如果不相等了,,證明已并發(fā)了,被修改了,,于是拋出 ConcurrentModificationException 異常,。 23、HashMap 和 HashTable 有什么區(qū)別,?①,、HashMap 是線程不安全的,HashTable 是線程安全的,; ②,、由于線程安全,所以 HashTable 的效率比不上 HashMap,; ③,、HashMap最多只允許一條記錄的鍵為null,允許多條記錄的值為null,,而 HashTable不允許,; ④、HashMap 默認初始化數(shù)組的大小為16,,HashTable 為 11,,前者擴容時,,擴大兩倍,,后者擴大兩倍+1; ⑤,、HashMap 需要重新計算 hash 值,,而 HashTable 直接使用對象的 hashCode,; 24、HashMap 是線程安全的嗎,?不是,,在多線程環(huán)境下,1.7 會產(chǎn)生死循環(huán),、數(shù)據(jù)丟失,、數(shù)據(jù)覆蓋的問題,1.8 中會有數(shù)據(jù)覆蓋的問題,,以 1.8 為例,,當(dāng) A 線程判斷 index 位置為空后正好掛起,B 線程開始往 index 位置的寫入節(jié)點數(shù)據(jù),,這時 A 線程恢復(fù)現(xiàn)場,,執(zhí)行賦值操作,就把 A 線程的數(shù)據(jù)給覆蓋了,;還有++size 這個地方也會造成多線程同時擴容等問題,。 25、如何規(guī)避 HashMap 的線程不安全,?單線程條件下,,為避免出現(xiàn)ConcurrentModificationException,需要保證只通過HashMap本身或者只通過Iterator去修改數(shù)據(jù),,不能在Iterator使用結(jié)束之前使用HashMap本身的方法修改數(shù)據(jù),。因為通過Iterator刪除數(shù)據(jù)時,HashMap的modCount和Iterator的expectedModCount都會自增,,不影響二者的相等性,。如果是增加數(shù)據(jù),只能通過HashMap本身的方法完成,,此時如果要繼續(xù)遍歷數(shù)據(jù),,需要重新調(diào)用iterator()方法從而重新構(gòu)造出一個新的Iterator,使得新Iterator的expectedModCount與更新后的HashMap的modCount相等,。 多線程條件下,,可使用兩種方式:
26,、HashMap 和 ConcurrentHashMap 的區(qū)別,?
27,、為什么 ConcurrentHashMap 比 HashTable 效率要高,?HashTable:使用一把鎖(鎖住整個鏈表結(jié)構(gòu))處理并發(fā)問題,多個線程競爭一把鎖,,容易阻塞,; ConcurrentHashMap:
28、說說 ConcurrentHashMap中 鎖機制JDK 1.7 中,,采用分段鎖的機制,,實現(xiàn)并發(fā)的更新操作,底層采用數(shù)組+鏈表的存儲結(jié)構(gòu),,包括兩個核心靜態(tài)內(nèi)部類 Segment 和 HashEntry,。 ①、Segment 繼承 ReentrantLock(重入鎖) 用來充當(dāng)鎖的角色,,每個 Segment 對象守護每個散列映射表的若干個桶,; ②、HashEntry 用來封裝映射表的鍵-值對,; ③,、每個桶是由若干個 HashEntry 對象鏈接起來的鏈表 JDK 1.8 中,,采用Node + CAS + Synchronized來保證并發(fā)安全。取消類 Segment,,直接用 table 數(shù)組存儲鍵值對;當(dāng) HashEntry 對象組成的鏈表長度超過 TREEIFY_THRESHOLD 時,,鏈表轉(zhuǎn)換為紅黑樹,,提升性能。底層變更為數(shù)組 + 鏈表 + 紅黑樹,。 29,、在 JDK 1.8 中,ConcurrentHashMap 為什么要使用內(nèi)置鎖 synchronized 來代替重入鎖 ReentrantLock,?①,、粒度降低了; ②,、JVM 開發(fā)團隊沒有放棄 synchronized,,而且基于 JVM 的 synchronized 優(yōu)化空間更大,更加自然,。 ③,、在大量的數(shù)據(jù)操作下,對于 JVM 的內(nèi)存壓力,,基于 API 的 ReentrantLock 會開銷更多的內(nèi)存,。 30、能對ConcurrentHashMap 做個簡單介紹嗎,?①,、重要的常量: private transient volatile int sizeCtl; 當(dāng)為負數(shù)時,-1 表示正在初始化,,-N 表示 N - 1 個線程正在進行擴容,; 當(dāng)為 0 時,表示 table 還沒有初始化,; 當(dāng)為其他正數(shù)時,,表示初始化或者下一次進行擴容的大小。 ②,、數(shù)據(jù)結(jié)構(gòu): Node 是存儲結(jié)構(gòu)的基本單元,,繼承 HashMap 中的 Entry,用于存儲數(shù)據(jù),; TreeNode 繼承 Node,,但是數(shù)據(jù)結(jié)構(gòu)換成了二叉樹結(jié)構(gòu),是紅黑樹的存儲結(jié)構(gòu),,用于紅黑樹中存儲數(shù)據(jù),; TreeBin 是封裝 TreeNode 的容器,,提供轉(zhuǎn)換紅黑樹的一些條件和鎖的控制。 ③,、存儲對象時(put() 方法):
④、擴容方法 transfer():默認容量為 16,,擴容時,,容量變?yōu)樵瓉淼膬杀丁,! elpTransfer():調(diào)用多個工作線程一起幫助進行擴容,,這樣的效率就會更高。 ⑤,、獲取對象時(get()方法):
31,、熟悉ConcurrentHashMap 的并發(fā)度嗎,?程序運行時能夠同時更新 ConccurentHashMap 且不產(chǎn)生鎖競爭的最大線程數(shù)。默認為 16,,且可以在構(gòu)造函數(shù)中設(shè)置,。當(dāng)用戶設(shè)置并發(fā)度時,,ConcurrentHashMap 會使用大于等于該值的最小2冪指數(shù)作為實際并發(fā)度(假如用戶設(shè)置并發(fā)度為17,實際并發(fā)度則為32),。 參考:http:///gFInl 總結(jié)好了,,就寫這么多了,文章中很多已經(jīng)不是HashMap知識點了,,但,,面試很有可能會問這些知識點,多準(zhǔn)備點也算是有備無患,。
|
|