HashMap 的基础结构,必须掌握!

开发 后端
在 HashMap 中,每个键(key)映射到一个值(value)。散列表的工作原理是:当通过 put() 方法将键值对存储在 HashMap 中时,HashMap 首先会根据键的 hashCode 值来计算出存储位置,然后将键值对存储在该位置上。

HashMap 是一种散列表,它存储的内容是键值对(key-value)映射。在 HashMap 中,每个键(key)映射到一个值(value)。散列表的工作原理是:当通过 put() 方法将键值对存储在 HashMap 中时,HashMap 首先会根据键的 hashCode 值来计算出存储位置,然后将键值对存储在该位置上。当通过 get() 方法获取键值对时,HashMap 再根据键的 hashCode 值来获取存储位置,然后返回该位置上的值。

hash算法的优化:对每个hash值,在它的低16位中,让高低16位进行异或,让它的低16位同时保持了高低16位的特征,尽量避免一些hash值后续出现冲突,大家可能会进入数组的同一位置。

对寻址算法的优化

(p = tab[i = (n - 1) & hash] 
 
 // (n-1) & hash ==> 数组里的一个位置

hash & (n-1) 效果是跟hash对n取模是一样的,但是与运算的性能要比hash对n取模要高很多。数组的长度会一直是2的n次方,只要他保持数组长度是2的n次方。

  • 寻址为什么不用取模?

对于上面寻址算法,由于计算机对比取模,与运算会更快。所以为了效率,HashMap 中规定了哈希表长度为 2 的 k 次方,而 2^k-1 转为二进制就是 k 个连续的 1,那么 hash & (k 个连续的 1) 返回的就是 hash 的低 k 个位,该计算结果范围刚好就是 0 到 2^k-1,即 0 到 length - 1,跟取模结果一样。

也就是说,哈希表长度 length 为 2 的整次幂时, hash & (length - 1) 的计算结果跟 hash % length 一样,而且效率还更好。

  • 为什么不直接用 hashCode() 而是用它的高 16 位进行异或计算新 hash 值?#

int 类型占 32 位,可以表示 2^32 种数(范围:-2^31 到 2^31-1),而哈希表长度一般不大,在 HashMap 中哈希表的初始化长度是 16(HashMap 中的 DEFAULT_INITIAL_CAPACITY),如果直接用 hashCode 来寻址,那么相当于只有低 4 位有效,其他高位不会有影响。这样假如几个 hashCode 分别是 210、220、2^30,那么寻址结果 index 就会一样而发生冲突,所以哈希表就不均匀分布了。

寻址算法的优化:用与运算替代取模,提升性能。(由于计算机对比取模,与运算会更快)。

在 JDK1.8 中,HashMap 的结构由数组和链表(或红黑树)组成。数组是 HashMap 的主体,链表和红黑树则是为了解决哈希冲突而存在的。从上图可以看出,HashMap 由一个个 Node 节点组成,每个节点包含了键值对的信息,以及指向下一个节点的指针。HashMap 内部维护了一个数组 table,每个元素都是一个链表的头节点(或者是一个红黑树的根节点),当多个键映射到同一个位置时,它们会被存储在同一个链表中(或者是同一个红黑树中)。当链表长度超过阈值(默认为 8)时,链表就会被转换成红黑树(如下图),这样可以提高查找效率。如果红黑树的节点数小于等于6,那么就将红黑树转换回链表,以节省空间。

转换红黑树

在 JDK1.8 中,HashMap 还引入了一个新的概念,叫做负载因子(load factor),它是指哈希表中键值对的数量与数组长度的比值。当键值对的数量超过了负载因子与数组长度的乘积时,就会触发扩容操作,HashMap 会自动将数组长度扩大一倍,并将原来的键值对重新分配到新的数组中。这样做的目的是为了保证散列表的性能,因为当负载因子过高时,散列表的性能会急剧下降。

责任编辑:姜华 来源: 今日头条
相关推荐

2021-07-18 08:23:47

校招git编程

2023-11-01 08:01:48

数据结构软件工程

2020-03-24 11:19:45

数据结构程序员存储

2017-03-30 16:03:06

Linux运维工程师技能

2021-12-03 18:04:06

命令 RabbitMQ Web

2024-03-28 10:29:33

企业CIOIT专业人员

2019-07-19 16:15:20

Java日志命令

2019-08-07 15:20:08

Git开源命令

2018-06-12 15:55:07

编程语言Java加密方式

2009-12-22 09:48:57

必须掌握的CMD命令

2019-06-20 17:39:12

Android启动优化

2018-11-30 14:47:13

2022-08-22 16:37:54

深度学习概率分布

2011-08-18 10:21:06

云计算

2018-10-09 09:42:27

MySQL优化单表

2020-11-05 09:26:55

Cookie和Sess

2020-11-29 16:52:13

数据库SQL数据分析

2010-06-29 10:35:19

串口协议

2012-02-22 21:38:40

2023-09-15 08:14:48

HashMap负载因子
点赞
收藏

51CTO技术栈公众号