Java集合框架是面试中的高频考点,涉及底层数据结构、核心方法原理、线程安全性、性能对比等,以下是常见的面试题分类及典型问题:
一、基础概念
- Java集合框架的整体结构是什么?分为哪几类?(Collection和Map两大体系,Collection下的List/Set/Queue,Map的键值对结构)
- Collection和Collections有什么区别?(Collection是接口,Collections是工具类,提供排序、同步化等静态方法)
- 集合框架中的迭代器(Iterator)有什么作用?如何使用?fail-fast机制是什么?(遍历集合元素,
hasNext()+next();快速失败:迭代时修改集合会抛ConcurrentModificationException) - 增强for循环(foreach)的底层原理是什么?能替代迭代器吗?(基于Iterator实现,但无法在循环中删除元素,否则抛异常)
二、List接口
- ArrayList和LinkedList的区别?(底层:动态数组 vs 双向链表;性能:随机访问快 vs 插入删除快;内存:ArrayList有扩容浪费,LinkedList节点占额外内存)
- ArrayList的初始容量是多少?扩容机制是什么?(JDK 8中初始容量0,首次添加时扩容为10;后续扩容为原容量的1.5倍,通过
Arrays.copyOf()复制数组) - LinkedList为什么不能高效实现随机访问(
get(int index))?(需要从表头/表尾遍历,时间复杂度O(n)) - Vector和ArrayList的区别?(Vector线程安全,方法加了
synchronized,效率低;扩容默认翻倍,ArrayList是1.5倍) - 如何将ArrayList转换为线程安全的集合?(
Collections.synchronizedList(list),或使用CopyOnWriteArrayList)
三、Set接口
- HashSet、LinkedHashSet、TreeSet的区别?(底层:HashMap vs LinkedHashMap vs TreeMap;特性:无序 vs 插入顺序 vs 自然排序/定制排序;是否允许null:HashSet/LinkedHashSet允许1个null,TreeSet不允许)
- HashSet如何保证元素不重复?(依赖元素的
hashCode()和equals():先比较哈希值,不同则直接存入;相同再用equals()判断,若为false则以链表/红黑树形式存储) - 为什么重写
equals()必须重写hashCode()?(否则可能导致HashSet中出现相同元素:例如两个对象equals()为true,但hashCode()不同,会被视为不同元素存入) - TreeSet的排序原理是什么?(元素需实现
Comparable接口,或通过Comparator定制排序,底层红黑树按比较结果维护顺序)
四、Map接口
- HashMap、HashTable、TreeMap、LinkedHashMap的区别?
- 底层:HashMap(数组+链表/红黑树)、HashTable(同HashMap,线程安全)、TreeMap(红黑树)、LinkedHashMap(HashMap+双向链表,维护插入/访问顺序)
- 线程安全:HashTable安全(方法加锁),其余非安全
- 排序:TreeMap支持自然排序,LinkedHashMap保持插入/访问顺序,其余无序
- null键值:HashMap允许1个null键+多个null值,HashTable不允许null,TreeMap的key不能为null(需比较)
- HashMap的底层数据结构?JDK 7和JDK 8有什么区别?(JDK 7:数组+链表;JDK 8:数组+链表+红黑树,链表长度>8且数组容量>64时转红黑树,优化查询效率)
- HashMap的哈希函数如何实现?为什么这么设计?(
(key.hashCode() ^ (key.hashCode() >>> 16)) & (n-1),高16位与低16位异或,减少哈希冲突,用位运算替代取模提升效率) - HashMap的扩容机制(resize)?(初始容量16,负载因子0.75,当元素数>容量×负载因子时扩容为2倍;JDK 8中扩容时链表拆分采用尾插法,避免死循环)
- ConcurrentHashMap的线程安全实现?JDK 7和JDK 8的区别?
- JDK 7:分段锁(Segment数组,每个Segment是一个小HashMap,锁粒度为Segment,减少并发冲突)
- JDK 8:取消Segment,采用
CAS+synchronized(对链表头/红黑树根节点加锁),粒度更细,性能更好
- HashMap和ConcurrentHashMap在并发场景下可能出现什么问题?(HashMap并发扩容可能导致死循环、数据丢失;ConcurrentHashMap通过锁机制避免这些问题)
- LinkedHashMap如何实现LRU缓存?(设置
accessOrder=true,每次访问元素后移到链表尾部,淘汰头部元素即最近最少使用的元素)
五、线程安全集合
- 哪些集合是线程安全的?(Vector、HashTable、Stack,以及
Collections.synchronizedXXX()返回的集合,CopyOnWriteArrayList、CopyOnWriteArraySet、ConcurrentHashMap等) - CopyOnWriteArrayList的原理?适合什么场景?(写时复制:修改时复制一份新数组,修改后替换原数组,读不加锁;适合读多写少场景,如配置缓存)
- 为什么ConcurrentHashMap比HashTable效率高?(HashTable是全局锁,ConcurrentHashMap是分段锁/CAS+局部锁,支持更高并发)
六、性能与设计
- 如何选择合适的集合?(根据是否有序、是否允许重复、增删改查频率、是否需要线程安全等场景选择,例如:随机访问多选ArrayList,频繁插入删除多选LinkedList,去重选HashSet,排序选TreeSet,键值对选HashMap,并发选ConcurrentHashMap)
- 集合的遍历方式有哪些?哪种效率高?(for循环(ArrayList高效)、迭代器(通用)、foreach(底层迭代器);LinkedList用迭代器比for循环高效,因为避免了多次遍历定位)
- 如何实现一个自定义的集合类?(需实现Collection/Map接口,重写
size()、isEmpty()、iterator()等核心方法,考虑线程安全和性能)
这些问题覆盖了集合框架的核心知识点,面试中常结合底层源码(如HashMap的put()、resize()方法)和实际场景(如“如何设计一个高并发的缓存系统”)进行延伸,建议结合源码和实践理解,而非死记硬背。