經典面試題之ConcurrentHashMap

2020-04-01 18:49:46 小盒子的技術分享

一 ConcurrentHashMap 與 HashMap的區別？

ConcurrentHashMap線程安全，而HashMap非線程安全
HashMap允許Key和Value為null，而ConcurrentHashMap不允許
HashMap不允許通過Iterator遍歷的同時通過HashMap修改，而ConcurrentHashMap允許該行為，並且該更新對後續的遍歷可見

以上說的比較籠統，我們具體看一下ConcurrentHashMap：

先來看下ConcurrentHashMap的數據結構

1.8之前的 ConcurrentHashMap是在1.7HashMap的基礎上實現了線程安全的版本。採用分段鎖的概念，使鎖更加細化。它默認將Hash表分為16個分段，segments數組的長度最大為65536，最大容量 1 << 30。

JDK1.8 的實現已經摒棄了 Segment 的概念，而是直接用 Node 數組 + 鏈表 + 紅黑樹的數據結構來實現，併發控制使用 Synchronized 和 CAS 來操作，整個看起來就像是優化過且線程安全的 HashMap，雖然在 JDK1.8 中還能看到 Segment 的數據結構，但是已經簡化了屬性，只是為了兼容舊版本。

二 concurrentHashMap最大容量？

<code>
/**
     * The largest possible table capacity.  This value must be
     * exactly 1<<30 to stay within Java array allocation and indexing
     * bounds for power of two table sizes, and is further required
     * because the top two bits of 32bit hash fields are used for
     * control purposes.
     */
    private static final int MAXIMUM_CAPACITY = 1 << 30;/<code>

注意這是 The largest possible table capacity，它是否代表最多能存儲到map中的元素數量？答案是否定的。至於為什麼，作為思考題，留給你。（關於這個問題在前一個系列關於HashMap的文章中也提到過相似的問題）

提示看一下size方法，為什麼n要設計為long？實際元素數量和返回值一樣嗎？

<code>public int size() {
        long n = sumCount();
        return ((n < 0L) ? 0 :
                (n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE :
                (int)n);
    }/<code>

三 ConcurrentHashMap 也會出現死循環？

是的，當你不當地使用computeIfAbsent 方法時

<code>/**
     * If the specified key is not already associated with a value,
     * attempts to compute its value using the given mapping function
     * and enters it into this map unless {@code null}.  The entire
     * method invocation is performed atomically, so the function is
     * applied at most once per key.  Some attempted update operations 

     * on this map by other threads may be blocked while computation
     * is in progress, so the computation should be short and simple,
     * and must not attempt to update any other mappings of this map.

/<code>

上面的computeIfAbsent 方法註釋也得很清楚了，應該絕對避免在computeIfAbsent中有遞歸，或者修改map的任何操作。所以如果你在調用此方法並有上述操作時就會出現死循環問題。至於為什麼會出現這種問題，有興趣的可以讀讀其他資料或源代碼，本文就不詳述了。好在這個問題在java 1.9中已經基本修復了。

問題如何規避？既然官方給出這麼強烈的提示了，不作死就不會死。或者升級到JDK1.9

四 ConcurrentHashMap 在 JDK 1.8 中，為什麼要使用內置鎖 synchronized 來代替重入鎖 ReentrantLock？

粒度降低了(看下圖感覺下鎖粒度的變化)
JVM 開發團隊沒有放棄 synchronized，而且基於 JVM 的 synchronized 優化空間更大，更加自然。
在大量的數據操作下，對於 JVM 的內存壓力，基於 API 的 ReentrantLock 會開銷更多的內存。

JDK1.8的ConcurrentHashMap（TreeBin: 紅黑二叉樹節點

Node: 鏈表節點）

五 put() 方法流程？

<code>/**     * The largest possible table capacity.  This value must be     * exactly 1<<30 to stay within Java array allocation and indexing     * bounds for power of two table sizes, and is further required     * because the top two bits of 32bit hash fields are used for     * control purposes.     */    private static final int MAXIMUM_CAPACITY = 1 << 30;/<code>

如果沒有初始化，就調用 initTable() 方法來進行初始化；
如果沒有 hash 衝突就直接 CAS 無鎖插入；
如果需要擴容，就先進行擴容；
如果存在 hash 衝突，就加鎖來保證線程安全，兩種情況：一種是鏈表形式就直接遍歷到尾端插入，一種是紅黑樹就按照紅黑樹結構插入；
如果該鏈表的數量大於閥值 8，就要先轉換成紅黑樹的結構，break 再一次進入循環
如果添加成功就調用 addCount() 方法統計 size，並且檢查是否需要擴容。

擴容方法 transfer()：默認容量為 16，擴容時，容量變為原來的兩倍。
helpTransfer()：調用多個工作線程一起幫助進行擴容，這樣的效率就會更高。

六 ConcurrentHashMap 的併發度是什麼？

程序運行時能夠同時更新 ConccurentHashMap 且不產生鎖競爭的最大線程數。默認為 16，且可以在構造函數中設置。當用戶設置併發度時，ConcurrentHashMap 會使用大於等於該值的最小2冪指數作為實際併發度（假如用戶設置併發度為17，實際併發度則為32）

七 ConcurrentHashMap的get方法是否要加鎖，為什麼？

不需要。get沒有加鎖的話，ConcurrentHashMap是如何保證讀到的數據不是髒數據的呢？

get操作全程不需要加鎖是因為Node的成員val是用volatile修飾的。

八 ConcurrentHashMap 如何計算 size

size()方法返回的是一個不精確的值

我們先來看一下jdk1.8的代碼註釋：

大致的意思是：返回容器的大小。這個方法應該被用來代替size()方法，因為 ConcurrentHashMap的容量大小可能會大於int的最大值。返回的值是一個估計值;如果有併發插入或者刪除操作，則實際的數量可能有所不同。

<code>/**
     * Returns the number of mappings. This method should be used
     * instead of {@link #size} because a ConcurrentHashMap may
     * contain more mappings than can be represented as an int. The
     * value returned is an estimate; the actual count may differ if
     * there are concurrent insertions or removals.
     *（大致的意思是：返回容器的大小。這個方法應該被用來代替size()方法，因為
     * ConcurrentHashMap的容量大小可能會大於int的最大值。
     * 返回的值是一個估計值;如果有併發插入或者刪除操作，則實際的數量可能有所不同。）
     * @return the number of mappings
     * @since 1.8
     */
    public long mappingCount() {
        long n = sumCount();
        return (n < 0L) ? 0L : n; // ignore transient negative values
    }/<code>

1.7中 Segment繼承ReentrantLock，這樣就很容易對每個Segment加鎖了。類似於get或remove這些操作，都只需要在操作前對一個Segment加鎖。但是有些操作需要跨段，比如size()、containsValue()和isEmpty()方法，因此為了保證併發效率，允許size返回的是一個近似值而不是精確值。

1.7的 put、remove和get操作只需要關心一個Segment，而size操作需要遍歷所有的Segment才能算出整個Map的大小。一個簡單的方案是，先鎖住所有Sgment，計算完後再解鎖。但這樣做，在做size操作時，不僅無法對Map進行寫操作，同時也無法進行讀操作，不利於對Map的並行操作。為更好支持併發操作，

ConcurrentHashMap會在不上鎖的前提逐個Segment計算3次size，如果某相鄰兩次計算獲取的所有Segment的更新次數（每個Segment都與HashMap一樣通過modCount跟蹤自己的修改次數，Segment每修改一次其modCount加一）相等，說明這兩次計算過程中無更新操作，則這兩次計算出的總size相等，可直接作為最終結果返回。如果這三次計算過程中Map有更新，則對所有Segment加鎖重新計算Size。

jdk 1.8 put方法和remove方法都會通過addCount方法維護Map的size。size方法通過sumCount獲取由addCount方法維護的Map的size。

<code>final long sumCount() {
        CounterCell[] as = counterCells; CounterCell a;
        long sum = baseCount;
        if (as != null) {
            for (int i = 0; i < as.length; ++i) {
                if ((a = as[i]) != null)
                    sum += a.value;
            }
        }
        return sum;
    }


 private final void addCount(long x, int check) {
        CounterCell[] as; long b, s;
        if ((as = counterCells) != null ||
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
            CounterCell a; long v; int m;
            boolean uncontended = true;
            if (as == null || (m = as.length - 1) < 0 ||
                (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                !(uncontended =
                  U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
                fullAddCount(x, uncontended);
                return;
            }
            if (check <= 1)
                return; 

            s = sumCount();
        }/<code>

注意兩個屬性：baseCount 和 counterCells。

baseCount 一個 volatile 的變量，在 addCount 方法中會使用它，而 addCount 方法在 put 結束後會調用。在 addCount 方法中，會對這個變量做 CAS 加法。
counterCells 一種用於分配計數的填充單元。改編自LongAdder和Striped64

總結

JDK1.7 和 JDK1.8 對 size 的計算是不一樣的。1.7 中是先不加鎖計算三次，如果三次結果不一樣在加鎖
JDK1.8 size 是通過對 baseCount 和 counterCell 進行 CAS 計算，最終通過 baseCount 和遍歷 CounterCell 數組得出 size。
JDK 8 推薦使用mappingCount 方法，因為這個方法的返回值是 long 類型，不會因為 size 方法是 int 類型限制最大值。

九用了ConcurrentHashMap 就一定是線程安全的嗎？

不一定，ConcurrenetHashMap 只能保證提供的原子性讀寫操作是線程安全的，換句話說，如果你的讀寫操作不是原子性的，那麼無法保證絕對的線程安全。如果你希望在一整段業務邏輯中，對容器的操作都保持整體一致性的話，需要另外加鎖處理。

ConcurrentHashMap 對外提供的方法或能力的限制：

使用了 ConcurrentHashMap，不代表對它的多個操作之間的狀態是一致的，是沒有其他線程在操作它的，如果需要確保需要手動加鎖。
諸如 size、isEmpty 和 containsValue 等聚合方法，在併發情況下可能會反映 ConcurrentHashMap 的中間狀態。因此在併發情況下，這些方法的返回值只能用作參考，而不能用於流程控制。
諸如 putAll 這樣的聚合方法也不能確保原子性，在 putAll 的過程中去獲取數據可能會獲取到部分數據。

分享到:

閱讀更多 小盒子的技術分享 的文章

關鍵字: 跳槽那些事兒數據結構面試題

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"