一、认识
HashSet其实就是一个没有重复数据的集合,基本用法很简单,我们直接给个例子。
public class Test { public static void main(String[] args) { HashSet set = new HashSet(); // 将元素添加到Set中 set.add("a"); //加入一个存在的则会替换。 set.add("a"); //是否包含某个值 System.out.println("是否包含了a:", set.contains("a")); // 删除HashSet中的“e” set.remove("e"); // 将Set转换为数组 String[] arr = (String[])set.toArray(new String[0]); // 遍历HashSet for(Iterator iterator = set.iterator();iterator.hasNext();) System.out.println(iterator.next()); // 清空HashSet set.clear(); } }
以上只是列出了其最简单的用法。下面我们看看其继承关系。HashSet主要继承了三个接口Serializable、Cloneable、Set,并且实现了抽象类AbstractSet。我们直接看看源码:
public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java.io.Serializable
学过HashMap的人应该都知道HashMap实现的是Map接口,而HashSet是Set接口。
下面我们就从源码的角度来分析一下HashSet。
二、源码分析
1、参数变量
//这个HashMap就是实际保存HashSet元素的容器 private transient HashMap<E,Object> map; //PRESENT表示的意思很简单,也就是我们的HashSet只使用到了HashMap的key, //所以此处定义一个静态的常量Object类,来充当HashMap的value private static final Object PRESENT = new Object();
这里有个问题,那就是既然HashSet只使用到了HashMap的key,为什么不使用null来充当HashMap的value,而使用了PRESENT这个对象呢?
答:想要深入这个问题,我们还需要深入到源码中看看:
public boolean add(E e) { return map.put(e, PRESENT)==null; } public boolean remove(Object o) { return map.remove(o)==PRESENT; }
以上两个是增删方法,在add一个元素的时候,其实调用的就是map.put(e,
PRESENT)==null,HashMap在put元素的时候会出现两种情况:
情况一:put的元素是新的,那么map.put会发现key没有,那么直接插入即可。return结果为true。
情况二:put的元素是旧的,那么map.put会发现key已有,则直接返回相应的value,也就是PRESENT,PRESENT不等于null,return的也就是false了,表示HashSet插入失败。如果我们这里使用null为map.put的参数呢?直接返回相应的value,也就是null,这时候null==null是true。竟然返回了true。很明显就是错误的返回结果呀。
这其实也是去重复的原理。对于删除方法其实也是一样的。
2、构造函数
public HashSet() { map = new HashMap<E,Object>(); } public HashSet(Collection<? extends E> c) { map = new HashMap<E,Object>(Math. max((int) (c.size()/.75f) + 1, 16)); addAll(c); } public HashSet( int initialCapacity, float loadFactor) { map = new HashMap<E,Object>(initialCapacity, loadFactor); } public HashSet( int initialCapacity) { map = new HashMap<E,Object>(initialCapacity); } HashSet( int initialCapacity, float loadFactor, boolean dummy) { map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor); }
HashSet提供的构造方法很多,有5个,在这里我想说明的是每一种构造方法,其实都是创建的HashMap。这也证明了我们文章开头提到的内部基于HashMap。
3、其他方法
增删方法我们已经提到了,在这里我们主要看一下其他方法。
//底层利用的还是HashMap public boolean contains(Object o) { return map .containsKey(o); } //检查是否包含指定集合中所有元素 public boolean containsAll(Collection<?> c) { Iterator<?> e = c.iterator(); //只要集合c中有一个元素不属于HashSet,返回false while (e.hasNext()) if (!contains(e.next())) return false; return true; }
上面的方法还包含了遍历元素的方式。
HashSet就是这么简单,源码里面几乎所有的方法都是HashMap实现的。