12.19 HashMap 為什麼線程不安全?

來源:https://www.cnblogs.com/developer_chan/p/10450908.html

前言:我們都知道HashMap是線程不安全的,在多線程環境中不建議使用,但是其線程不安全主要體現在什麼地方呢,本文將對該問題進行解密。

1.jdk1.7中的HashMap

在jdk1.8中對HashMap做了很多優化,這裡先分析在jdk1.7中的問題,相信大家都知道在jdk1.7多線程環境下HashMap容易出現死循環,這裡我們先用代碼來模擬出現死循環的情況:

HashMap 為什麼線程不安全?

上述代碼比較簡單,就是開多個線程不斷進行put操作,並且HashMap與AtomicInteger都是全局共享的。在多運行幾次該代碼後,出現如下死循環情形:

HashMap 為什麼線程不安全?

其中有幾次還會出現數組越界的情況:

HashMap 為什麼線程不安全?

這裡我們著重分析為什麼會出現死循環的情況,通過jps和jstack命名查看死循環情況,結果如下:

HashMap 為什麼線程不安全?

從堆棧信息中可以看到出現死循環的位置,通過該信息可明確知道死循環發生在HashMap的擴容函數中,根源在transfer函數中,jdk1.7中HashMap的transfer函數如下:

HashMap 為什麼線程不安全?


總結下該函數的主要作用:

在對table進行擴容到newTable後,需要將原來數據轉移到newTable中,注意10-12行代碼,這裡可以看出在轉移元素的過程中,使用的是頭插法,也就是鏈表的順序會翻轉,這裡也是形成死循環的關鍵點。下面進行詳細分析。

1.1 擴容造成死循環分析過程

前提條件:

這裡假設

#1.hash算法為簡單的用key mod鏈表的大小。

#2.最開始hash表size=2,key=3,7,5,則都在table[1]中。

#3.然後進行resize,使size變成4。

未resize前的數據結構如下:

HashMap 為什麼線程不安全?

如果在單線程環境下,最後的結果如下:

HashMap 為什麼線程不安全?

這裡的轉移過程,不再進行詳述,只要理解transfer函數在做什麼,其轉移過程以及如何對鏈表進行反轉應該不難。

然後在多線程環境下,假設有兩個線程A和B都在進行put操作。線程A在執行到transfer函數中第11行代碼處掛起,因為該函數在這裡分析的地位非常重要,因此再次貼出來。

HashMap 為什麼線程不安全?

此時線程A中運行結果如下:

HashMap 為什麼線程不安全?

線程A掛起後,此時線程B正常執行,並完成resize操作,結果如下:

HashMap 為什麼線程不安全?

這裡需要特別注意的點:由於線程B已經執行完畢,根據Java內存模型,現在newTable和table中的Entry都是主存中最新值:7.next=3,3.next=null。

此時切換到線程A上,在線程A掛起時內存中值如下:e=3,next=7,newTable[3]=null,代碼執行過程如下:

<code>newTable[3]=e ----> newTable[3]=3
e=next ----> e=7/<code>

此時結果如下:

HashMap 為什麼線程不安全?

繼續循環:

<code>e=7
next=e.next ----> next=3【從主存中取值】
e.next=newTable[3] ----> e.next=3【從主存中取值】
newTable[3]=e ----> newTable[3]=7
e=next ----> e=3/<code>

結果如下:

HashMap 為什麼線程不安全?

再次進行循環:

<code>e=3
next=e.next ----> next=null
e.next=newTable[3] ----> e.next=7 即:3.next=7
newTable[3]=e ----> newTable[3]=3
e=next ----> e=null/<code>

注意此次循環:e.next=7,而在上次循環中7.next=3,出現環形鏈表,並且此時e=null循環結束。

結果如下:

HashMap 為什麼線程不安全?

在後續操作中只要涉及輪詢hashmap的數據結構,就會在這裡發生死循環,造成悲劇。

1.2 擴容造成數據丟失分析過程

遵照上述分析過程,初始時:

HashMap 為什麼線程不安全?

線程A和線程B進行put操作,同樣線程A掛起:

HashMap 為什麼線程不安全?

此時線程A的運行結果如下:

HashMap 為什麼線程不安全?

此時線程B已獲得CPU時間片,並完成resize操作:

HashMap 為什麼線程不安全?

同樣注意由於線程B執行完成,newTable和table都為最新值:5.next=null

此時切換到線程A,在線程A掛起時:e=7,next=5,newTable[3]=null。

執行newtable[i]=e,就將7放在了table[3]的位置,此時next=5。接著進行下一次循環:

<code>e=5
next=e.next ----> next=null,從主存中取值
e.next=newTable[1] ----> e.next=5,從主存中取值
newTable[1]=e ----> newTable[1]=5
e=next ----> e=null/<code>

將5放置在table[1]位置,此時e=null循環結束,3元素丟失,並形成環形鏈表。並在後續操作hashmap時造成死循環。

HashMap 為什麼線程不安全?

2.jdk1.8中HashMap

在jdk1.8中對HashMap進行了優化,在發生hash碰撞,不再採用頭插法方式,而是直接插入鏈表尾部,因此不會出現環形鏈表的情況,但是在多線程的情況下仍然不安全,這裡我們看jdk1.8中HashMap的put操作源碼:


HashMap 為什麼線程不安全?


HashMap 為什麼線程不安全?

這是jdk1.8中HashMap中put操作的主函數, 注意第6行代碼,如果沒有hash碰撞則會直接插入元素。如果線程A和線程B同時進行put操作,剛好這兩條不同的數據hash值一樣,並且該位置數據為null,所以這線程A、B都會進入第6行代碼中。假設一種情況,線程A進入後還未進行數據插入時掛起,而線程B正常執行,從而正常插入數據,然後線程A獲取CPU時間片,此時線程A不用再進行hash判斷了,問題出現:線程A會把線程B插入的數據給覆蓋,發生線程不安全。

這裡只是簡要分析下jdk1.8中HashMap出現的線程不安全問題的體現,後續將會對java的集合框架進行總結,到時再進行具體分析。

總結

首先HashMap是線程不安全的,其主要體現:

#1.在jdk1.7中,在多線程環境下,擴容時會造成環形鏈或數據丟失。

#2.在jdk1.8中,在多線程環境下,會發生數據覆蓋的情況。


分享到:


相關文章: