HashMap高频面试题，让你掌握青铜回答与王者级回答，你值得拥有-51CTO.COM

HashMap的实现原理是什么？

HashMap是一个高频的面试题，那么如何才能回答的比较合适呢？

一、青铜级

以下是jdk1.7与jdk1.8中hashmap的区别：

概括下可以从以下几个方面来回答：

1、基本原理

HashMap是一个基于Hash散列技术，以键值对形式存储的数据结构。

2、数据存储

JDK 1.8 之前的 HashMap 使用的数组+链表的结构，插入时使用头插法。

JDK 1.8 之后的 HashMap 使用的数组+链表/红黑树的结构，插入时使用头插法。

3、哈希冲突

JDK 1.8 之前的 HashMap 使用的是拉链法（Chaining）作为冲突解决策略。

JDK 1.8 引入了红黑树作为替代链表的冲突解决策略。

4、扩容和负载因子

当哈希表中的元素数量超过一定阈值时，HashMap 会自动进行扩容，以保持较低的负载因子，从而提高性能。

二、王者级

可以从以下几个方面来回答：

1、基本原理

HashMap是一个基于Hash散列技术，以键值对形式存储的数据结构。

2、数据存储

HashMap内部维护一个数组，这个数组的每个位置都是一个链表或红黑树的头节点。这些节点用于存储键值对。

	jdk1.8之前	jdk1.8之后(含1.8)
结构	数组+链表	数组+链表/红黑树
数组类型	Entry数组	Node数组

（1）JDK1.8之前

JDK1.8之前的 HashMap 由 Entry 数组组成，Entry 类是 HashMap 中存储键值对的类。Entry 类包含 key、value 和 next 三个属性。key 是键，value 是值，next 是指向下一个 Entry 对象的指针，出现 hash 冲突存放到链表中。具体源码是通过 put() 方法实现的。

put() 方法的实现如下：

public V put(K key, V value) {
    // 如果哈希表为空，则对其进行申请数组空间
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }

    // 如果 key 为 null，则将其放入 null 键的特殊位置
    if (key == null) {
        return putForNullKey(value);
    }

    // 计算 key 的哈希值
    int hash = hash(key);

    // 根据哈希值和哈希表的长度计算索引位置
    int i = indexFor(hash, table.length);

    // 遍历索引位置上的链表，寻找 key
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        // 如果 key 相同，则更新 value 并返回旧值
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    // 如果 key 不存在，则添加一个新的链表成员
    modCount++;
    addEntry(hash, key, value, i);
    return null;
}

put() 方法首先计算 key 的 hash 值，然后定位到数组索引位置。如果数组索引位置上已经存在 Entry 对象，则判断 key 是否相同。如果相同则直接覆盖value，否则添加到链表中。如果数组索引位置上不存在 Entry 对象，则直接添加到数组中。

链表的具体实现如下：

static class Entry<K, V> implements Map.Entry<K, V> {

    final int hash;
    final K key;
    V value;
    Entry<K, V> next;

    Entry(int hash, K key, V value) {
        this.hash = hash;
        this.key = key;
        this.value = value;
    }

    @Override
    public K getKey() {
        return key;
    }

    @Override
    public V getValue() {
        return value;
    }

    @Override
    public V setValue(V newValue) {
        V oldValue = value;
        value = newValue;
        return oldValue;
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Entry<?, ?> entry = (Entry<?, ?>) o;
        return hash == entry.hash &&
        Objects.equals(key, entry.key) &&
        Objects.equals(value, entry.value);
    }

    @Override
    public int hashCode() {
        return Objects.hash(hash, key, value);
    }

    @Override
    public String toString() {
        return key + "=" + value;
    }
}

链表的每个元素是一个 Entry 对象，Entry 对象包含 key、value、hash 和 next 四个属性。key 是键，value 是值，hash 是 key 的 hash 值，next 是指向下一个 Entry 对象的指针。

当 HashMap 出现 hash 冲突时，会将新的 Entry 对象添加到链表的尾部。链表的查询性能较差，当链表长度过长时，会影响 HashMap 的查询性能。

源代码中有几处关键的地方：

关键一：

先通过indexFor下标定位到的数组元素位置，再遍历这个元素(链表)，依次和链表中的key比较，如果 key 相同就直接覆盖，不同就采用头插法插入元素。

关键二：

头插法的实现主要涉及到两个方法：addEntry 和 createEntry。addEntry 方法用于判断是否需要扩容，并调用 createEntry 方法将键值对存入数组中。createEntry 方法用于创建一个新的节点，并将其 next 属性指向原来的链表头节点，然后将新节点赋值给数组对应位置，完成头插法。

插入元素使用createEntry，新元素会的next指向table[bucketIndex]也就是链表的头节点。

（2）JDK1.8之后(含1.8)

JDK1.8的 HashMap 由 Node 数组组成，Node 类是 HashMap 中存储键值对的类。Node 类包含 key、value、hash、next 和 prev 五个属性。key 是键，value 是值，hash 是 key 的 hash 值，next 是指向下一个 Node 对象的指针，prev 是指向前一个 Node 对象的指针。
JDK1.8之后的 HashMap 由 Node 数组组成，出现 hash 冲突存放到链表中同时满足条件的情况下会生成红黑树。具体源码是通过 put() 方法实现的。

put() 方法的实现如下：

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
    // 获取哈希表
    Node<K,V>[] tab = table;
    // 如果哈希表为空或长度为0，则进行扩容
    if (tab == null || tab.length == 0) {
        tab = resize();
    }
    // 计算索引位置
    int n = tab.length;
    int i = (n - 1) & hash;

    // 如果索引位置上的节点为空，则添加一个新的节点
    Node<K,V> p = tab[i];
    if (p == null) {
        tab[i] = newNode(hash, key, value, null);
    } else {
        // 如果索引位置上的节点存在，则遍历链表，寻找 key 相同的节点
        Node<K,V> e; K k;
        if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) {
            e = p;
        } else if (p instanceof TreeNode) {
            // 如果索引位置上的节点是红黑树节点，则调用红黑树的 putTreeVal() 方法添加新的节点
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        } else {
            // 如果索引位置上的节点是链表节点，则遍历链表，寻找 key 相同的节点
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    // 如果没有找到 key 相同的节点，则在链表尾部添加一个新的节点
                    p.next = newNode(hash, key, value, null);
                    // 如果链表长度超过阈值，则将链表转换为红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) {
                        treeifyBin(tab, hash);
                    }
                    break;
                }
                if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) {
                    // 如果找到 key 相同的节点，则停止遍历
                    break;
                }
                p = e;
            }
        }

        if (e != null) { // 找到 key 相同的节点
            // 获取旧值
            V oldValue = e.value;
            // 如果只有 key 不存在才添加新的节点，则仅当旧值为 null 时才更新值
            if (!onlyIfAbsent || oldValue == null) {
                e.value = value;
            }
            // 调用 afterNodeAccess() 方法更新节点的访问时间
            afterNodeAccess(e);
            return oldValue;
        }
    }

    // 添加新的节点后，更新 HashMap 的大小和修改次数
    ++modCount;
    if (++size > threshold) {
        resize();
    }
    // 调用 afterNodeInsertion() 方法更新节点的插入状态
    afterNodeInsertion(evict);
    return null;
}

put() 方法在添加元素时，会先判断数组索引位置上是否已经存在 Node 对象。如果已经存在，则判断 key 是否相同。如果相同则更新 value，否则添加到链表中。

如果链表长度超过阈值，则将链表转换为红黑树。阈值的默认值是 8。

treeifyBin() 方法的实现如下：

final void treeifyBin(Node<K,V>[] tab, int hash) {
    // 如果哈希表为空或长度小于 MIN_TREEIFY_CAPACITY，则进行扩容
    int n, index; Node<K,V> e;
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY) {
        resize();
    } else if ((e = tab[index = (n - 1) & hash]) != null) {
        // 获取索引位置上的节点
        TreeNode<K,V> hd = null, tl = null;
        // 遍历链表，将每个节点转换为红黑树节点
        do {
            TreeNode<K,V> p = replacementTreeNode(e, null);
            if (tl == null) {
                hd = p;
            } else {
                p.prev = tl;
                tl.next = p;
            }
            tl = p;
        } while ((e = e.next) != null);
        // 将转换后的红黑树节点添加到哈希表中
        if ((tab[index] = hd) != null) {
            hd.treeify(tab);
        }
    }
}

treeifyBin() 方法首先判断链表的长度是否超过阈值。如果超过阈值，则将链表的第一个元素作为红黑树的根节点。

然后，将链表中的所有元素添加到红黑树中。

最后，将红黑树的根节点添加到数组中。

这样，当 HashMap 出现 hash 冲突存放到链表中同时满足条件的情况下，会将链表转换为红黑树，提高查询性能。

源代码中有几处关键的地方：

关键一：

当链表的节点数量达到阈值(默认为 8 )，执行 treeifyBin 方法。

关键二：

进入treeifyBin方法后还有一个逻辑就是当数组长度大于或者等于 64 的情况下，才会执行转换红黑树操作，以减少搜索时间。否则，就是只是对数组扩容。所以链表长度大于阈值不是转为红黑树的唯一条件。

关键三：

区别于jdk1.7，jdk1.8已经使用了尾插法实现链表元素的插入。

问题：为什么jdk1.8后改为尾插法？

主要是因为头插法在多线程扩容情况下会引起链表环。那什么是链表环呢？

线程1，第一节点为A，第二节点为B后面就没有了，遍历过程为A->B然后B没有后面节点即遍历结束。

这时线程1挂起。线程2引发扩容，扩容后为B->A。这时线程1遍历就会发现A的下一节点是B，会发现遍历B时B还有后续的节点为A，这样就出样链表环了。

（3）Node 与Entry区别

在 Java 的 HashMap 中，Node 和 Entry 都是用于表示键值对的数据结构，但它们在不同版本的 HashMap 中有一些区别：

Node：

Node 是在 JDK 1.8 之后的版本中引入的，用于存储键值对。
Node 主要用于存储在哈希冲突的情况下，将键值对以链表或红黑树的方式组织起来的数据结构。
Node 是 TreeNode 和 LinkedNode 的父类，这两个子类分别用于表示红黑树节点和链表节点。
Node 中包含了键、值、哈希码、下一个节点引用等信息。

Entry：

Entry 是在 JDK 1.7 及之前的版本中用于存储键值对的数据结构。
Entry 是 HashMap 内部的静态内部类，用于表示键值对。
Entry 主要用于存储在哈希冲突的情况下，将键值对以链表的方式组织起来的数据结构。
Entry 中包含了键、值、下一个 Entry 的引用等信息。

Node 和 Entry 都用于表示键值对，但它们的命名和实现方式在不同的 Java 版本中有所不同。Node 主要用于 JDK 1.8 及之后的 HashMap，而 Entry 主要用于 JDK 1.7 及之前的 HashMap。Node 进一步改进了哈希冲突的处理方式，引入了红黑树来提高性能。

3、哈希冲突

JDK 1.8 之前的 HashMap 使用的是拉链法（Chaining）作为冲突解决策略。

HashMap 通过 key 的 hashCode 经过扰动函数处理过后得到 hash 值，然后通过 (n - 1) & hash 判断当前元素存放的位置，如果当前位置存在元素的话，就判断该元素与要存入的元素的 hash 值以及 key 是否相同，如果相同的话，直接覆盖，不相同就通过拉链法解决冲突。以下就是JDK1.7中的hashcode扰动函数。

JDK 1.8 中，HashMap 使用了拉链法和红黑树两种冲突解决策略。当链表长度超过一定阈值时，会将链表转换为红黑树。红黑树是一种自平衡二叉树，具有较高的查询性能。以下就是JDK1.8中的hashcode扰动函数。

JDK1.8 中的 HashMap 在查询性能上比 JDK1.7 中的 HashMap 有一定的提升。

以下是 JDK1.7 和 JDK1.8 中 HashMap 解决哈希冲突方法的具体对比：

JDK1.8 中的 HashMap 解决哈希冲突的方法更加灵活，可以适应不同的场景。

4、扩容和负载因子

当哈希表中的元素数量超过一定阈值时，HashMap 会自动进行扩容，以保持较低的负载因子，从而提高性能。

Java HashMap 使用负载因子来控制扩容。负载因子是指 HashMap 中键值对数与 HashMap 容量的比值。

HashMap 的初始容量为 16，负载因子为 0.75。这意味着，当 HashMap 中键值对数达到 16 * 0.75 = 12 时，HashMap 就会进行扩容。

HashMap 的扩容方式是将容量扩大为原来的 2 倍。例如，当 HashMap 的容量为 16 时，扩容后容量为 32。

HashMap 扩容的原因是，当 HashMap 的负载因子达到一定值时，HashMap 的查询性能会下降。这是因为，当 HashMap 的容量较小，并且键值对数较多时，会导致哈希冲突的概率增加。

因此，HashMap 会在负载因子达到一定值时进行扩容，以提高查询性能。

以下是 HashMap 扩容的具体步骤：

创建一个新的 HashMap，容量为原来的 2 倍。
将原 HashMap 中的所有键值对复制到新 HashMap 中。
将原 HashMap 置为空。