前言
文本已收录至我的GitHub仓库,欢迎Star:github.com/bin39232820…
种一棵树最好的时间是十年前,其次是现在
絮叨
今天讲Set,List,Map已经讲完了,Set有时候我们也会用,去重,但是Stream流也有去重的方法所以现在也是用的少了,我这边打算就讲一个HashSet,有机会把函数式编程Stream写一下,巩固一下 哈哈。
🔥史上最全的Java容器集合之ArrayList(源码解读)
🔥史上最全的Java容器集合之Vector和LinkedList(源码解读)
🔥史上最全的Java容器集合之equals 和 hashCode
🔥史上最全的Java容器集合之ConcurrentHashMap(源码解读)
🔥史上最全的Java容器集合之LinkedHashMap(源码解读)
HashSet概述
HashSet的代码行数 300多行,是我见过最少代码的集合了,非常简单,它有以下的特点
- 没有重复元素的集合。底层基于HashMap来实现。
- 非线程安全,创建线程安全的HashMap可以使用Collections.synchronizedSet。
HashSet源码解读
继承关系
- 继承AbstractSet抽象类,实现Set接口
- 实现java.io.Serialization接口,支持序列化
- 实现Cloneable接口,支持对象克隆,浅复制
属性
//使用HashMap来保存HashSet的元素 private transient HashMap<E,Object> map; //HashSet只使用到key,因此使用一个静态常量来充当HashSet的value值 private static final Object PRESENT = new Object(); 复制代码
构造方法
//使用默认容量大小16以及加载因子0.75初始化HashMap,构造HashSet public HashSet() { map = new HashMap<>(); } //初始化指定集合和默认加载因子0.75的map,构造HashSet public HashSet(Collection<? extends E> c) { map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16)); addAll(c); } //使用指定容量大小和加载因子初始化map,构造HashSet public HashSet(int initialCapacity, float loadFactor) { map = new HashMap<>(initialCapacity, loadFactor); } //使用指定容量大小和默认加载因子0.75初始化map,构造HashSet public HashSet(int initialCapacity) { map = new HashMap<>(initialCapacity); } //包访问权限,构造空的LinkedHashSet HashSet(int initialCapacity, float loadFactor, boolean dummy) { map = new LinkedHashMap<>(initialCapacity, loadFactor); 复制代码
方法
- size()方法:内部调用Map的size方法。
public int size() { return map.size(); } 复制代码
- isEmpty()方法,也是调用map,里面是通过判断size是否为0来判断是否为null
public boolean isEmpty() { return map.isEmpty(); } 复制代码
- add()方法
HashSet的add方法内部通过HashMap.put()方法来实现key的添加,在HashMap内部真正执行的是putVal()方法,putVal这边就不说了 HashMap讲过
public boolean add(E e) { return map.put(e, PRESENT)==null; } 复制代码
总结
HashSet 还真没啥讲了 ,就是把HashMap的key 拿来当数据存,基本上都是调用的是HashMap的方法,所以说讲的也少,总结一下吧
- HashSet的实现支持null的key,同时HashSet的内部不支持重复的key
- 不重复
- 线程不安全
彩蛋
因为篇幅实在是太少了,TreeSet的底层是TreeMap,红黑树,这个知识点,我先欠着哈哈,所以也不算讲了。也就意味着Java容器要完结了,至少我们把大多数常用的容器过了一遍了,就算是面试也不至于说一问三不知了。
我们知道 ArrayList LinkedList HashMap HashSet 都是线程不安全的,但是有一个类可以让他们变的线程安全,它就是 Collections
- Collections.synchronizedList
- Collections.synchronizedMap
- Collections.synchronizedSet
这个彩蛋就是我们来解密一下这个方法,挑选其中一个来讲
Collections.synchronizedList(List list) 方法源码
正常情况下,Collections.synchronizedList(List list) 返回的是一个 SynchronizedList 的对象,这个对象以组合的方式将对 List 的接口方法操作,委托给传入的 list 对象,并且对所有的接口方法对象加锁,得到并发安全性。
public static <T> List<T> synchronizedList(List<T> list) { return (list instanceof RandomAccess ? new SynchronizedRandomAccessList<>(list) : new SynchronizedList<>(list)); } 复制代码
我们可以看出,他其实就是new 了一个SynchronizedList ,那这个类又是何方神圣呢,继续看
static class SynchronizedList<E> extends SynchronizedCollection<E> implements List<E> { ... ... final List<E> list; SynchronizedList(List<E> list) { super(list); this.list = list; } SynchronizedList(List<E> list, Object mutex) { super(list, mutex); this.list = list; } ... ... public E get(int index) { synchronized (mutex) {return list.get(index);} } public E set(int index, E element) { synchronized (mutex) {return list.set(index, element);} } public void add(int index, E element) { synchronized (mutex) {list.add(index, element);} } public E remove(int index) { synchronized (mutex) {return list.remove(index);} } ... ... } 复制代码
可以看到,SynchronizedList 的实现里,get, set, add 等操作都加了 mutex 对象锁,再将操作委托给最初传入的 list。 这就是以组合的方式,将非线程安全的对象,封装成线程安全对象,而实际的操作都是在原非线程安全对象上进行,只是在操作前给加了同步锁。
由于有很多业务场景下都有这种需求,所以 Java 类库中封装了这个工具类,给需要的模块使用。
但是值得一提的是,要是论Map的安全集合,还是ConcurrentHashMap效率比较高点,毕竟对象锁的粒度也是比较粗了。
版本说明
这里的源码是JDK8版本,不同版本可能会有所差异,但是基本原理都是一样的。
结尾
因为博主也是一个开发萌新 我也是一边学一边写 我有个目标就是一周 二到三篇 希望能坚持个一年吧 希望各位大佬多提意见,让我多学习,一起进步。