HashSet集合 - undefined

HashSet是Set接口的一个实现类，它所存储的元素是不可重复的，并且元素都是无序的。当向HashSet集合中添加一个元素时，首先会调用该元素的hashCode()方法来确定元素的存储位置，然后再调用元素对象的equals()方法来确保该位置没有重复元素。Set集合与List集合存取元素的方式都一样，在此不再进行赘述，接下来通过一个案例来演示HashSet集合的用法，如文件1所示。

文件1 Example09.java

 1    import java.util.HashSet;
 2    public class Example09 {
 3        public static void main(String[] args) {
 4            HashSet set = new HashSet();  
 5            set.add("Jack");                 
 6            set.add("Eve");
 7            set.add("Rose");
 8            set.add("Rose");                // 向该Set集合中添加重复元素 
 9            // 遍历输出Set集合中的元素
 10            set.forEach(o -> System.out.println(o));
 11        }
 12    }

运行结果如图1所示。

图1 运行结果

文件1中，首先通过add()方法向HashSet集合依次添加了四个字符串元素，然后通过forEach(Consumer action)方法遍历所有的元素并输出打印。从打印结果可以看出取出元素的顺序与添加元素的顺序并不一致，并且重复存入的字符串元素“Rose”被去除了，只添加了一次。

HashSet集合之所以能确保不出现重复的元素，是因为它在存入元素时做了很多工作。当调用HashSet集合的add()方法存入元素时，首先调用当前存入元素的hashCode()方法获得对象的哈希值，然后根据对象的哈希值计算出一个存储位置。如果该位置上没有元素，则直接将元素存入，如果该位置上有元素存在，则会调用equals()方法让当前存入的元素依次和该位置上的元素进行比较，如果返回的结果为false就将该元素存入集合，返回的结果为true则说明有重复元素，就将该元素舍弃。整个存储的流程如图2所示。

图2 HashSet对象存储过程

根据前面的分析不难看出，当向集合中存入元素时，为了保证HasheSet正常工作，要求在存入对象时，需要重写Object类中的hashCode()和equals()方法。文件6-9中将字符串存入HashSet时，String类已经默认重写了hashCode()和equals()方法。但是如果将开发者自定义的类型对象存入HashSet，结果又如何呢？接下来通过一个案例来进行演示将Student类型对象存入HashSet，如文件2所示。

文件2 Example10.java

 1    import java.util.*;
 2    class Student {
 3        String id;
 4        String name;                     
 5        public Student(String id,String name) {         
 6            this.id=id;
 7            this.name = name;
 8        }
 9        public String toString() {                          
 10            return id+":"+name;
 11        }
 12    }
 13    public class Example10 {
 14        public static void main(String[] args) {
 15            HashSet hs = new HashSet();                       
 16            Student stu1 = new Student("1", "Jack");    
 17            Student stu2 = new Student("2", "Rose");
 18            Student stu3 = new Student("2", "Rose");
 19            hs.add(stu1);
 20            hs.add(stu2);
 21            hs.add(stu3);
 22            System.out.println(hs);
 23        }
 24    }

运行结果如图3所示。

图3 运行结果

在文件2中，向HashSet集合存入三个Student对象，然后打印该Set集合进行查看。图6-17所示的运行结果中出现了两个相同的学生信息“2:Rose”，这样的学生信息应该被视为重复元素，不允许同时出现在HashSet集合中。之所以没有去掉这样的重复元素是因为在定义Student类时没有重写hashCode()和equals()方法，因此创建的这两个学生对象sut2和sut3所引用的对象地址不同，所以HashSet集合会认为这是两个不同的对象。接下来针对文件2中的Student类进行改写，增加重写的hashCode()和equals()方法，假设id相同的学生就是同一个学生，修改后的代码示例如下：

class Student {
    private String id;
    private String name;
    public Student(String id, String name) { 
        this.id = id;
        this.name = name;
    }
      // 重写toString()方法
    public String toString() { 
        return id + ":" + name;
    }
      // 重写hashCode()方法
    public int hashCode() { 
        return id.hashCode();    // 返回id属性的哈希值
    }
      // 重写equals()方法
    public boolean equals(Object obj) { 
        if (this == obj) {     // 判断是否是同一个对象
            return true;       // 如果是，直接返回true
        }
        if (!(obj instanceof Student)) {     // 判断对象是为Student类型
            return false;       // 如果对象不是Student类型，返回false
        }
        Student stu = (Student) obj;          // 将对象强转为Student类型
         boolean b = this.id.equals(stu.id); // 判断id值是否相同
        return    b;                                 // 返回判断结果
    }

再次运行文件2，结果如图4所示。

图4 运行结果

在修改后的文件2中，Student类重写了Object类的hashCode()和equals()方法。在hashCode()方法中返回id属性的哈希值，在equals()方法中比较对象的id是否相等，并返回结果。当调用HashSet集合的add()方法添加stu3对象时，发现它的哈希值与stu2对象相同，而且stu2.equals(stu3)返回true，HashSet集合认为两个对象相同，因此重复的Student对象被舍弃了。