HashSet集合
HashSet是Set接口的一个实现类,它所存储的元素是不可重复的,并且元素都是无序的。当向HashSet集合中添加一个元素时,首先会调用该元素的hashCode()方法来确定元素的存储位置,然后再调用元素对象的equals()方法来确保该位置没有重复元素。Set集合与List集合存取元素的方式都一样,在此不再进行赘述,接下来通过一个案例来演示HashSet集合的用法,如文件1所示。
文件1 Example09.java
1 import java.util.HashSet;
2 public class Example09 {
3 public static void main(String[] args) {
4 HashSet set = new HashSet();
5 set.add("Jack");
6 set.add("Eve");
7 set.add("Rose");
8 set.add("Rose"); // 向该Set集合中添加重复元素
9 // 遍历输出Set集合中的元素
10 set.forEach(o -> System.out.println(o));
11 }
12 }
运行结果如图1所示。
图1 运行结果
文件1中,首先通过add()方法向HashSet集合依次添加了四个字符串元素,然后通过forEach(Consumer action)方法遍历所有的元素并输出打印。从打印结果可以看出取出元素的顺序与添加元素的顺序并不一致,并且重复存入的字符串元素“Rose”被去除了,只添加了一次。
HashSet集合之所以能确保不出现重复的元素,是因为它在存入元素时做了很多工作。当调用HashSet集合的add()方法存入元素时,首先调用当前存入元素的hashCode()方法获得对象的哈希值,然后根据对象的哈希值计算出一个存储位置。如果该位置上没有元素,则直接将元素存入,如果该位置上有元素存在,则会调用equals()方法让当前存入的元素依次和该位置上的元素进行比较,如果返回的结果为false就将该元素存入集合,返回的结果为true则说明有重复元素,就将该元素舍弃。整个存储的流程如图2所示。
图2 HashSet对象存储过程
根据前面的分析不难看出,当向集合中存入元素时,为了保证HasheSet正常工作,要求在存入对象时,需要重写Object类中的hashCode()和equals()方法。文件6-9中将字符串存入HashSet时,String类已经默认重写了hashCode()和equals()方法。但是如果将开发者自定义的类型对象存入HashSet,结果又如何呢?接下来通过一个案例来进行演示将Student类型对象存入HashSet,如文件2所示。
文件2 Example10.java
1 import java.util.*;
2 class Student {
3 String id;
4 String name;
5 public Student(String id,String name) {
6 this.id=id;
7 this.name = name;
8 }
9 public String toString() {
10 return id+":"+name;
11 }
12 }
13 public class Example10 {
14 public static void main(String[] args) {
15 HashSet hs = new HashSet();
16 Student stu1 = new Student("1", "Jack");
17 Student stu2 = new Student("2", "Rose");
18 Student stu3 = new Student("2", "Rose");
19 hs.add(stu1);
20 hs.add(stu2);
21 hs.add(stu3);
22 System.out.println(hs);
23 }
24 }
运行结果如图3所示。
图3 运行结果
在文件2中,向HashSet集合存入三个Student对象,然后打印该Set集合进行查看。图6-17所示的运行结果中出现了两个相同的学生信息“2:Rose”,这样的学生信息应该被视为重复元素,不允许同时出现在HashSet集合中。之所以没有去掉这样的重复元素是因为在定义Student类时没有重写hashCode()和equals()方法,因此创建的这两个学生对象sut2和sut3所引用的对象地址不同,所以HashSet集合会认为这是两个不同的对象。接下来针对文件2中的Student类进行改写,增加重写的hashCode()和equals()方法,假设id相同的学生就是同一个学生,修改后的代码示例如下:
class Student {
private String id;
private String name;
public Student(String id, String name) {
this.id = id;
this.name = name;
}
// 重写toString()方法
public String toString() {
return id + ":" + name;
}
// 重写hashCode()方法
public int hashCode() {
return id.hashCode(); // 返回id属性的哈希值
}
// 重写equals()方法
public boolean equals(Object obj) {
if (this == obj) { // 判断是否是同一个对象
return true; // 如果是,直接返回true
}
if (!(obj instanceof Student)) { // 判断对象是为Student类型
return false; // 如果对象不是Student类型,返回false
}
Student stu = (Student) obj; // 将对象强转为Student类型
boolean b = this.id.equals(stu.id); // 判断id值是否相同
return b; // 返回判断结果
}
再次运行文件2,结果如图4所示。
图4 运行结果
在修改后的文件2中,Student类重写了Object类的hashCode()和equals()方法。在hashCode()方法中返回id属性的哈希值,在equals()方法中比较对象的id是否相等,并返回结果。当调用HashSet集合的add()方法添加stu3对象时,发现它的哈希值与stu2对象相同,而且stu2.equals(stu3)返回true,HashSet集合认为两个对象相同,因此重复的Student对象被舍弃了。