Java中HashSet集合是如何对自定义对象进行去重

开发 后端
Set集合常用于元素为数字、字符串去重等,但是当元素为自定义对象类型时,Set去重是否与我们预计一致?下面将以HashSet为例,通过一系列试验来一步步验证。

Java中Set接口是Collectio的子接口,Set集合不允许包含相同的元素。如果添加相同的元素, add()会返回FALSE, 新元素不会加入。Set集合常用于元素为数字、字符串去重等,但是当元素为自定义对象类型时,Set去重是否与我们预计一致?下面将以HashSet为例,通过一系列试验来一步步验证。

[[282768]]

1. 先建立一个FootBallPlayer足球运动员类

Java中HashSet集合是如何对自定义对象进行去重

2. (假设:HashSet会把属性值全相同的对象认定为重复),为了测试HashSet对对象去重效果与猜想是否一致,我们先构建三个对象实例,其中构造两个属性一致的“C罗”。

Java中HashSet集合是如何对自定义对象进行去重

结果:HashSet并没有认定两个“C罗”对象重复,三个实例都加入到了HashSet集合中。

Java中HashSet集合是如何对自定义对象进行去重

3. 在了解HashSet如何进行去重之前,先看看HashSet是怎么实现的。通过查看JDK源码发现HashSet内部其实是对HashMap进行操作。

Java中HashSet集合是如何对自定义对象进行去重

4. 继续查看hashSet的add()方法,其实是调用了HashMap的put()方法

Java中HashSet集合是如何对自定义对象进行去重

5. 继续追踪,直到putVal()方法(重点)

Java中HashSet集合是如何对自定义对象进行去重

Java中HashSet集合是如何对自定义对象进行去重

仔细看putVal()方法,发现其对于新入的元素是否重复判断依据为以下两种

  • 判断hash值是否相等,既通过判断hashCode()方法
  • 判断是否相等,通过equals()方法

6. 了解了两个判断条件后,我们先做一个简单实验,既调用Integer 、String 、Object等对象equals()方法进行对比

Java中HashSet集合是如何对自定义对象进行去重

结果发现,自定义Object对象equals返回的值为false。接下来我们逐一看看它们的equals实现方式

Java中HashSet集合是如何对自定义对象进行去重

(1) Integer对象的equals实现,通过阅读代码发现是判断依据是值是否相等。

 

Java中HashSet集合是如何对自定义对象进行去重

 

(2) String对象的equals实现,其判断的依据为:先判断引用的对象是否是同一个,再逐个对比其字符串的值

Java中HashSet集合是如何对自定义对象进行去重

(3)  而Object的判断依据为引用的对象是否是同一个,由于上面的两位足球运动员都是新new出来的,非同一个对象,所以equlas()返回结果为false

Java中HashSet集合是如何对自定义对象进行去重

7. 看完了equlas的实现,接下来看看Integer String Object的hashCode实现。同样先做一个简单的测试,调用它们的hashCode()方法计算出hash值进行对比

Java中HashSet集合是如何对自定义对象进行去重

实验为结果两个Object对象的hash值并不相等,接下来我们看看它们对于hashcode()的具体实现

Java中HashSet集合是如何对自定义对象进行去重

(1) 通过源码发现 Integer是通过对其value值来进运算行得到hash值。

 

Java中HashSet集合是如何对自定义对象进行去重

 

(2) String也是通过对其value值来进计算行得到hash值,所以测试中结果为true

Java中HashSet集合是如何对自定义对象进行去重

(3) 当查看Object的hashCode()方法时发现并无具体实现,通过查阅资料得知,JDK8的默认hashCode的计算是交给C++实现的,方法是通过和当前线程有关的一个随机数+三个确定值,运用Marsaglia's

xorshifschema随机数算法得到的一个随机数。所以两个不同的对象得到的hash值便不相同,测试结果也为false。(对于Object的hashCode()这里不做深入讨论,如果过深入了解的朋友也欢迎分享)

Java中HashSet集合是如何对自定义对象进行去重

8. 得知了HashSet是通过hashcode()与equals()来进行去重,且自定义Object对象的equals()和hashcode()实现原理,那么要实现HashSet按照我们期望的方式,当两个对象所有属性的值一致时认定为同一个对象,我们可以对FootBallPlayer类的equals()和hashcode()进行重写,代码如下

Java中HashSet集合是如何对自定义对象进行去重

  • hashCode() 重写为hash值是通过对对象所有属性的值进行运算得出。
  • equals() 重写为先判断引用的对象是否是同一个,再判断对象每一个属性值是否相等

9. 重写完方法,我们再重新执行一开始的程序,还是同样的三个足球运动员实例。结果与期望相同,HashSet对“C罗”对象进行了去重处理。

Java中HashSet集合是如何对自定义对象进行去重

总结

HashSet的底层是对HashMap的操作,其去重的原理通过hashCode()与equals()方法来判断是否重复。通过实验发现自定义对象没有成功去重的原因与JDK默认的Object对象hashCode()和equals()实现有关。对于自定义对象的去重,我们可以通过重写自定义对象的hashCode()与equals()使其按照我们所想要的规则进行去重操作。

责任编辑:赵宁宁 来源: 今日头条
相关推荐

2014-04-02 13:27:29

iOSNSArray对象

2010-03-01 11:10:41

WCF绑定元素

2022-04-14 15:12:40

Java8Stream列表

2021-12-15 06:58:13

List 集合LinkedHashS

2023-12-05 07:59:08

JS小技巧数组对象去重

2010-05-05 14:34:45

Oracle数据库

2009-08-04 13:31:35

C#自定义事件

2009-11-09 16:06:53

WCF自定义集合

2009-08-03 16:37:49

C#异常类

2019-08-19 13:40:34

Windows 10剪贴板Windows

2024-01-05 15:28:06

鸿蒙数据同步GlobalThis

2011-08-09 17:16:56

CoreAnimati动画

2021-11-23 15:06:42

Kubernetes 运维开源

2022-07-06 07:35:19

group byMySQL

2013-06-27 11:10:01

iOS开发自定义UISlider

2023-10-26 08:28:31

Python数据去重

2011-12-16 14:23:51

Java

2021-03-16 10:39:29

SpringBoot参数解析器

2019-12-02 21:29:45

Keras神经网络TensorFlow

2021-07-01 11:07:49

Swift 自定义操作符
点赞
收藏

51CTO技术栈公众号