「集合系列」- 深入淺出的分析 IdentityHashMap 技术頭條網

「集合系列」- 深入淺出的分析 IdentityHashMap

IdentityHashMap 從它的名字上可以看出來用於表示唯一的 HashMap，但是分析了其源碼，發現其數據結構與 HashMap 使用的數據結構完全不同。

01、摘要

在集合系列的第一章，咱們瞭解到，Map 的實現類有 HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties 等等。

應該有很多人不知道 IdentityHashMap 的存在，其中不乏工作很多年的 Java 開發者，本文主要從數據結構和算法層面，探討 IdentityHashMap 的實現。

02、簡介

IdentityHashMap 的數據結構很簡單，底層實際就是一個 Object 數組，但是在存儲上並沒有使用鏈表來存儲，而是將 K 和 V 都存放在 Object 數組上。

當添加元素的時候，會根據 Key 計算得到散列位置，如果發現該位置上已經有改元素，直接進行新值替換；如果沒有，直接進行存放。當元素個數達到一定閾值時，Object 數組會自動進行擴容處理。

打開 IdentityHashMap 的源碼，可以看到 IdentityHashMap 繼承了 AbstractMap 抽象類，實現了 Map 接口、可序列化接口、可克隆接口。

<code>public class IdentityHashMap    extends AbstractMap    implements Map, java.io.Serializable, Cloneable{    /**默認容量大小*/    private static final int DEFAULT_CAPACITY = 32;        /**最小容量*/    private static final int MINIMUM_CAPACITY = 4;        /**最大容量*/    private static final int MAXIMUM_CAPACITY = 1 << 29;        /**用於存儲實際元素的表*/    transient Object[] table;        /**數組大小*/    int size;    /**對Map進行結構性修改的次數*/    transient int modCount;    /**key為null所對應的值*/    static final Object NULL_KEY = new Object();        ......}/<code>

可以看到類的底層，使用了一個 Object 數組來存放元素；在對象初始化時，IdentityHashMap 容量大小為64；

<code>public IdentityHashMap() {    //調用初始化方法    init(DEFAULT_CAPACITY);}/<code>

<code>private void init(int initCapacity) {    //數組大小默認為初始化容量的2倍    table = new Object[2 * initCapacity];}/<code>

03、常用方法介紹

3.1、put方法

put 方法是將指定的 key, value 對添加到 map 裡。該方法首先會對map做一次查找，通過==判斷是否存在key，如果有，則將舊value返回，將新value覆蓋舊value；如果沒有，直接插入，數組長度+1，返回null。

源碼如下：

<code>public V put(K key, V value) {    //判斷key是否為空，如果為空，初始化一個Object為key    final Object k = maskNull(key);    retryAfterResize: for (;;) {        final Object[] tab = table;        final int len = tab.length;        //通過key、length獲取數組小編        int i = hash(k, len);                //循環遍歷是否存在指定的key        for (Object item; (item = tab[i]) != null;             i = nextKeyIndex(i, len)) {             //通過==判斷，是否數組中是否存在key            if (item == k) {                    V oldValue = (V) tab[i + 1];                    //新value覆蓋舊value                tab[i + 1] = value;                //返回舊value                return oldValue;            }        }                //數組長度 +1        final int s = size + 1;        //判斷是否需要擴容        if (s + (s << 1) > len && resize(len))            continue retryAfterResize;        //更新修改次數        modCount++;        //將k加入數組        tab[i] = k;        //將value加入數組        tab[i + 1] = value;        size = s;        return null;    }}/<code>

maskNull 函數，判斷 key 是否為空

<code>private static Object maskNull(Object key) {    return (key == null ? NULL_KEY : key);}/<code>

hash 函數，通過 key 獲取 hash 值，結合數組長度通過位運算獲取數組散列下標

<code>private static int hash(Object x, int length) {    int h = System.identityHashCode(x);    // Multiply by -127, and left-shift to use least bit as part of hash    return ((h << 1) - (h << 8)) & (length - 1);}/<code>

nextKeyIndex 函數，通過 hash 函數計算得到的數組散列下標，進行加2；因為一個 key、value 都存放在數組中，所以一個 map 對象佔用兩個數組下標，所以加2。

<code>private static int nextKeyIndex(int i, int len) {    return (i + 2 < len ? i + 2 : 0);}/<code>

resize 函數，通過數組長度，進行擴容處理，擴容之後的長度為當前長度的2倍

<code>private boolean resize(int newCapacity) {    //擴容後的數組長度，為當前數組長度的2倍    int newLength = newCapacity * 2;    Object[] oldTable = table;    int oldLength = oldTable.length;    if (oldLength == 2 * MAXIMUM_CAPACITY) { // can't expand any further        if (size == MAXIMUM_CAPACITY - 1)            throw new IllegalStateException("Capacity exhausted.");        return false;    }    if (oldLength >= newLength)        return false;    Object[] newTable = new Object[newLength];    //將舊數組內容轉移到新數組    for (int j = 0; j < oldLength; j += 2) {        Object key = oldTable[j];        if (key != null) {            Object value = oldTable[j+1];            oldTable[j] = null;            oldTable[j+1] = null;            int i = hash(key, newLength);            while (newTable[i] != null)                i = nextKeyIndex(i, newLength);            newTable[i] = key;            newTable[i + 1] = value;        }    }    table = newTable;    return true;}/<code>

3.2、get方法

get 方法根據指定的 key 值返回對應的 value。同樣的，該方法會循環遍歷數組，通過==判斷是否存在key，如果有，直接返回value，因為 key、value 是相鄰的存儲在數組中，所以直接在當前數組下標+1，即可獲取 value；如果沒有找到，直接返回null。

值得注意的地方是，在循環遍歷中，是通過==判斷當前元素是否與key相同，如果相同，則返回value。咱們都知道，在 java 中，==對於對象類型參數，判斷的是引用地址，確切的說，是堆內存地址，所以，這裡判斷的是key的引用地址是否相同，如果相同，則返回對應的 value；如果不相同，則返回null。

源碼如下：

<code>public V get(Object key) {    Object k = maskNull(key);    Object[] tab = table;    int len = tab.length;    int i = hash(k, len);        //循環遍歷數組，直到找到key或者，數組為空為值    while (true) {        Object item = tab[i];        //通過==判斷，當前數組元素與key相同        if (item == k)            return (V) tab[i + 1];        //數組為空        if (item == null)            return null;        i = nextKeyIndex(i, len);    }}/<code>

3.3、remove方法

remove 的作用是通過 key 刪除對應的元素。該方法會循環遍歷數組，通過==判斷是否存在key，如果有，直接將key、value設置為null，對數組進行重新排列，返回舊 value。

源碼如下：

<code>public V remove(Object key) {    Object k = maskNull(key);    Object[] tab = table;    int len = tab.length;    int i = hash(k, len);    while (true) {        Object item = tab[i];        if (item == k) {            modCount++;            //數組長度減1            size--;                V oldValue = (V) tab[i + 1];            //將key、value設置為null            tab[i + 1] = null;            tab[i] = null;            //刪除該元素後，需要把原來有衝突往後移的元素移到前面來            closeDeletion(i);            return oldValue;        }        if (item == null)            return null;        i = nextKeyIndex(i, len);    }}/<code>

closeDeletion 函數，刪除該元素後，需要把原來有衝突往後移的元素移到前面來，對數組進行重寫排列；

<code>private void closeDeletion(int d) {    // Adapted from Knuth Section 6.4 Algorithm R    Object[] tab = table;    int len = tab.length;    Object item;    for (int i = nextKeyIndex(d, len); (item = tab[i]) != null;         i = nextKeyIndex(i, len) ) {        int r = hash(item, len);        if ((i < r && (r <= d || d <= i)) || (r <= d && d <= i)) {            tab[d] = item;            tab[d + 1] = tab[i + 1];            tab[i] = null;            tab[i + 1] = null;            d = i;        }    }}/<code>

04、總結

IdentityHashMap 的實現不同於HashMap，雖然也是數組，不過IdentityHashMap中沒有用到鏈表，解決衝突的方式是計算下一個有效索引，並且將數據key和value緊挨著存在map中，即table[i]=key、table[i+1]=value；
IdentityHashMap 允許key、value都為null，當key為null的時候，默認會初始化一個Object對象作為key；
IdentityHashMap在保存、刪除、查詢數據的時候，以key為索引，通過==來判斷數組中元素是否與key相同，本質判斷的是對象的引用地址，如果引用地址相同，那麼在插入的時候，會將value值進行替換；

IdentityHashMap 測試例子：

<code>public static void main(String[] args) {    Map<string> identityMaps = new IdentityHashMap<string>();    identityMaps.put(new String("aa"), "aa");    identityMaps.put(new String("aa"), "bb");    identityMaps.put(new String("aa"), "cc");    identityMaps.put(new String("aa"), "cc");    //輸出添加的元素    System.out.println("數組長度："+identityMaps.size() + "，輸出結果：" + identityMaps);}/<string>/<string>/<code>

輸出結果：

<code>數組長度：4，輸出結果：{aa=aa, aa=cc, aa=bb, aa=cc}/<code>

儘管key的內容是一樣的，但是key的堆地址都不一樣，所以在插入的時候，插入了4條記錄。

05、參考

1、JDK1.7&JDK1.8 源碼

2、簡書 - 騎著烏龜去看海 - IdentityHashMap源碼解析

3、博客園 - leesf - IdentityHashMap源碼解析

分享到:

閱讀更多 科技伍小黑 的文章

關鍵字: 數據結構類有鏡音雙子

「集合系列」- 深入淺出的分析 IdentityHashMap

01、摘要

02、簡介

03、常用方法介紹

3.1、put方法

3.2、get方法

3.3、remove方法

04、總結

05、參考

相關文章:

一文讀懂，深入淺出 RPC框架

Python高級數據類型之字典、集合【明哥陪你學Python-六】

集合-HashSet源碼詳解

十一、迭代器模式與命令模式詳解

python數據類型-集合

Python系列篇五｜數據結構（列表、元組、集合、字典）

03.06 Python學習入門(12)—集合

02.29 Python 集合(Set)

深入淺出 Serverless：優勢、意義與應用

List、Map、Set的區別與聯繫

深入淺出：JWT(JSON Web Token)鑑權

01.03 深入淺出：Swoole單例模式及依賴注入進行Redis底層類庫封裝

10.21 c++linux 深入淺出 TCP

「原創」「python自學筆記」python列表，元組，集合，字典總結

深入淺出 Java 中 JVM 內存管理你瞭解嗎？

深入淺出 Hadoop YARN

深入淺出 RPC框架，一文學會

Python、大數據、Java全視頻資料，入門實戰，深入淺出

Python智闡5-列表、元組、字典、集合

提升MongoDB性能的方法

深入淺出 TCP

深入淺出 Java 中的包裝類（面試知識點）

組合數據類型（序列、集合、字典）

大神分享｜JAVA自學視頻共45G，JAVA基礎、深入淺出、入門精通！

07.25 深入淺出 SSL 管理配置實戰

Redis中數據類型的基本操作三 (Set 集合 Zset 有序集合）

JAVA面試要點-集合-精簡答案

深入淺出，瞭解 Spring 框架和 Spring Boot 的歷史

集合(Collection)小貼士：看看這些基礎集合類的區別與聯想

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Redis內存分析工具--rdr安裝與使用

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪