java集合理解(深入浅出)

简介: 一方面, 面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象 的操作,就要对对象进行存储。另一方面,使用Array 存储对象方面具有 一些弊 端 ,而 Java 集合就像一种容器,可以 动态地 把多个对象的引用放入容器中。

一方面, 面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象 的操作,就要对对象进行存储。另一方面,使用Array 存储对象方面具有 一些弊  ,而 Java 集合就像一种容器,可以 动态地 把多个对象的引用放入容器中。


数组在内存存储方面的特点:

数组初始化以后,长度就确定了。

数组声明的类型,就决定了进行元素初始化时的类型


数组在存储数据方面的弊端:

数组初始化以后,长度就不可变了,不便于扩展

数组中提供的属性和方法少,不便于进行添加、删除、插入等操作,且效率不高。

同时无法直接获取存储元素的个数

数组存储的数据是有序的、可以重复的。---->存储数据的特点单一

Java 集合类可以用于存储数量不等的多个对象,还可用于保存具有映射关系的

关联数组。


Java 集合可分为 Collection Map 两种体系

Collection接口:单列数据,定义了存取一组对象的方法的集合

List元素有序、可重复的集合

Set元素无序、不可重复的集合

Map接口:双列数据,保存具有映射关系“key-value对”的集合

86132ca5bd3247c7a1c97441e4a5d72b.png

00c8b7cc09c3420ea021717036c383a2.png


Collection 接口



Collection 接口是 ListSet Queue 接口的父接口,该接口里定义的方法 既可用于操作 Set 集合,也可用于操作 List Queue 集合。

JDK不提供此接口的任何直接实现,而是提供更具体的子接口(如:SetList) 实现。

Java5 之前,Java 集合会丢失容器中所有对象的数据类型,把所有对象都 当成 Object 类型处理;从 JDK 5.0 增加了泛型以后,Java 集合可以记住容 器中对象的数据类型。


Collection 接口方法

5a8c79090ffc479082f667a6ea41fd96.png

c01759bdca004719ac6effc643bf155f.png


Iterator迭代器接口


使用 Iterator 接口遍历集合元素

Iterator 对象称为迭代器 ( 设计模式的一种 ) ,主要用于遍历 Collection 集合中的元素。   GOF 给迭代器模式的定义为:提供一种方法访问一个容器 (container) 对象中各个元素,而又不需暴露该对象的内部细节。 迭代器模式,就是为容器而生。 类似于“公 交车上的售票员”、“火车上的乘务员”、“空姐”。 Collection 接口继承了 java.lang.Iterable 接口,该接口有一个 iterator() 方法,那么所 有实现了Collection 接口的集合类都有一个 iterator() 方法,用以返回一个实现了 Iterator接口的对象。


Iterator 仅用于遍历集合Iterator 本身并不提供承装对象的能力。如果需要创建

Iterator 对象,则必须有一个被迭代的集合。

 集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合

的第一个元素之前

691d78a0643b471a982e220b381423ca.png4533c8e952354c9c8fe63e14fcae08b5.pnga47c23c2559d46cb9af7e10701e52c9d.png63b9f795579547749ea31731d6cd48f4.png


看下下面的题你就可能理解了:

public class ForTest {
public static void main(String[] args) {
String[] str = new String[5];
for (String myStr : str) {
myStr = "atguigu";
System.out.println(myStr);
}
for (int i = 0; i < str.length; i++) {
System.out.println(str[i]);
} }
}

输出结果:

atguigu

atguigu

atguigu

atguigu

atguigu

null

null

null

null

null


Collection子接口之一:List接口



d3b70357e56e4a03895ec1fb0c3887d3.png27b5a73516c044968e64e6a595518907.png

下面来看一个踩坑题吧

public class list{
  public static void main(String[] args) {
    List aList=new ArrayList();
    aList.add(1);
    aList.add(2);
    aList.add(3);
    aList.remove(2);
    System.out.println(aList);
  }
}

输出结果:[1, 2]

public class list{
  public static void main(String[] args) {
    List aList=new ArrayList();
    aList.add(1);
    aList.add(2);
    aList.add(3);
    aList.remove(2);
    aList.remove(2);
    System.out.println(aList);
  }
}

错误:


Exception in thread "main" java.lang.IndexOutOfBoundsException: Index 2 out of bounds for length 2

   at java.base/jdk.internal.util.Preconditions.outOfBounds(Preconditions.java:64)

   at java.base/jdk.internal.util.Preconditions.outOfBoundsCheckIndex(Preconditions.java:70)

   at java.base/jdk.internal.util.Preconditions.checkIndex(Preconditions.java:266)

   at java.base/java.util.Objects.checkIndex(Objects.java:359)

   at java.base/java.util.ArrayList.remove(ArrayList.java:504)

   at list.main(list.java:313)


那么要如何删去2呢?很简单包装类:

public class list{
  public static void main(String[] args) {
    List aList=new ArrayList();
    aList.add(1);
    aList.add(2);
    aList.add(3);
    aList.remove(2);
    aList.remove(new Integer(2));
    System.out.println(aList);
  }
}

输出结果:[1]

image.pngimage.pngimage.pngimage.png


Set接口



Set接口是Collection的子接口,set接口没有提供额外的方法

Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个 Set 集合中,则添加操作失败。

Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals() 方法


image.png


向 HashSet 中添加元素的过程:


当向 HashSet 集合中存入一个元素时, HashSet 会调用该对象的 hashCode() 方法

来得到该对象的 hashCode 值,然后根据 hashCode 值,通过某种散列函数决定该对象

在 HashSet 底层数组中 的存储位置。(这个散列函数会与底层数组的长度相计算得到在

数组中的下标,并且这种散列函数计算还尽可能保证能均匀存储元素,越是散列分布,

该散列函数设计的越好)


如果两个元素的 hashCode() 值相等,会再继续调用 equals 方法,如果 equals 方法结果为 true ,添加失败;如果为 false ,那么会保存该元素,但是该数组的位置已经有元素了,那么会通过 链表的方式 继续链接。


如果两个元素的 equals() 方法返回 true ,但它们的 hashCode() 返回值不相 等,hashSet 将会把它们存储在不同的位置,但依然可以添加成功。


9afdb3a943d248caaf9dbc3f04a165b2.pnga7eebf9e3f494d70abc02b1af5cec997.png855ba34614a149aaac3a3e041ea9aecb.pngimage.pngimage.png08c66b66c8be4dee9adaa364e32bf135.pngimage.pngimage.png



Map接口



image.pngimage.pngimage.pngimage.png


HashMap 源码中的重要常量



DEFAULT_INITIAL_CAPACITY : HashMap 的默认容量, 16

MAXIMUM_CAPACITY : HashMap 的最大支持容量, 2^30

DEFAULT_LOAD_FACTOR : HashMap 的默认加载因子

TREEIFY_THRESHOLD : Bucket 中链表长度大于该默认值,转化为红黑树

UNTREEIFY_THRESHOLD : Bucket 中红黑树存储的 Node 小于该默认值,转化为链表

MIN_TREEIFY_CAPACITY : 桶中的 Node 被树化时最小的 hash 表容量。(当桶中 Node 的


数量大到需要变红黑树时,若 hash 表容量小于 MIN_TREEIFY_CAPACITY 时,此时应执行

resize 扩容操作这个 MIN_TREEIFY_CAPACITY 的值至少是 TREEIFY_THRESHOLD 的 4

倍。)


table : 存储元素的数组,总是 2 的 n 次幂

entrySet : 存储具体元素的集

size : HashMap 中存储的键值对的数量

modCount : HashMap 扩容和结构改变的次数。

threshold : 扩容的临界值, = 容量 * 填充因子

loadFactor : 填充因子

HashMap 的扩容

当 HashMap 中的元素越来越多的时候, hash 冲突的几率也就越来越高,因为数组的 长度是固定的。所以为了提高查询的效率,就要对HashMap 的数组进行扩容,而在 HashMap数组扩容之后,最消耗性能的点就出现了:原数组中的数据必须重新计算 其在新数组中的位置,并放进去,这就是resize 。


那么 HashMap 什么时候进行扩容呢?


当 HashMap 中的元素个数超过数组大小 ( 数组总大小 length, 不是数组中个数 size)*loadFactor 时 , 就 会 进 行 数 组 扩 容 , loadFactor 的默认 值 (DEFAULT_LOAD_FACTOR ) 为 0.75 ,这是一个折中的取值。也就是说,默认情况 下,数组大小( DEFAULT_INITIAL_CAPACITY ) 为 16 ,那么当 HashMap 中元素个数 超过16*0.75=12 (这个值就是代码中的 threshold 值,也叫做临界值)的时候,就把 数组的大小扩展为 2*16=32 ,即扩大一倍,然后重新计算每个元素在数组中的位置,

而这是一个非常消耗性能的操作, 所以如果我们已经预知 HashMap 中元素的个数, 那么预设元素的个数能够有效的提高HashMap 的性能。


那么 HashMap 什么时候进行扩容和树形化呢?


当 HashMap 中的元素个数超过数组大小 ( 数组总大小 length, 不是数组中个数 size)*loadFactor 时 ,就会进行数组扩容 , loadFactor 的默认 值 (DEFAULT_LOAD_FACTOR ) 为 0.75 ,这是一个折中的取值。也就是说,默认 情况下,数组大小( DEFAULT_INITIAL_CAPACITY ) 为 16 ,那么 HashMap 中 元素个数超过16*0.75=12 (这个值就是代码中的 threshold 值,也叫做临界值) 的时候,就把数组的大小扩展为 2*16=32 ,即扩大一倍,然后重新计算每个元 素在数组中的位置,而这是一个非常消耗性能的操作,所以如果我们已经预知


HashMap 中元素的个数,那么预设元素的个数能够有效的提高 HashMap 的性能。 当HashMap 中的其中一个链的对象个数如果达到了 8 个,此时如果 capacity 没有 达到64 ,那么 HashMap 会先扩容解决,如果已经达到了 64 ,那么这个链会变成 树,结点类型由Node 变成 TreeNode 类型。当然,如果当映射关系被移除后, 下次resize 方法时判断树的结点个数低于 6 个,也会把树再转为链表

 

5073b17adaa944888f006f2e6cf4fe14.png1682ee6497724156992634b5919a009e.png82150987b22b4d78b93640ff5dc654e8.pnge6206010308c499195b0c79019a1a0d5.png

相关文章
|
4天前
|
存储 安全 Java
Java 集合框架中的老炮与新秀:HashTable 和 HashMap 谁更胜一筹?
嗨,大家好,我是技术伙伴小米。今天通过讲故事的方式,详细介绍 Java 中 HashMap 和 HashTable 的区别。从版本、线程安全、null 值支持、性能及迭代器行为等方面对比,帮助你轻松应对面试中的经典问题。HashMap 更高效灵活,适合单线程或需手动处理线程安全的场景;HashTable 较古老,线程安全但性能不佳。现代项目推荐使用 ConcurrentHashMap。关注我的公众号“软件求生”,获取更多技术干货!
23 3
|
3月前
|
算法 Java 数据处理
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。HashSet基于哈希表实现,提供高效的元素操作;TreeSet则通过红黑树实现元素的自然排序,适合需要有序访问的场景。本文通过示例代码详细介绍了两者的特性和应用场景。
55 6
|
3月前
|
存储 Java
深入探讨了Java集合框架中的HashSet和TreeSet,解析了两者在元素存储上的无序与有序特性。
【10月更文挑战第16天】本文深入探讨了Java集合框架中的HashSet和TreeSet,解析了两者在元素存储上的无序与有序特性。HashSet基于哈希表实现,添加元素时根据哈希值分布,遍历时顺序不可预测;而TreeSet利用红黑树结构,按自然顺序或自定义顺序存储元素,确保遍历时有序输出。文章还提供了示例代码,帮助读者更好地理解这两种集合类型的使用场景和内部机制。
49 3
|
3月前
|
存储 Java 数据处理
Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位
【10月更文挑战第16天】Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位。本文通过快速去重和高效查找两个案例,展示了Set如何简化数据处理流程,提升代码效率。使用HashSet可轻松实现数据去重,而contains方法则提供了快速查找的功能,彰显了Set在处理大量数据时的优势。
39 2
|
21天前
|
存储 缓存 安全
Java 集合江湖:底层数据结构的大揭秘!
小米是一位热爱技术分享的程序员,本文详细解析了Java面试中常见的List、Set、Map的区别。不仅介绍了它们的基本特性和实现类,还深入探讨了各自的使用场景和面试技巧,帮助读者更好地理解和应对相关问题。
37 5
|
2月前
|
存储 缓存 安全
Java 集合框架优化:从基础到高级应用
《Java集合框架优化:从基础到高级应用》深入解析Java集合框架的核心原理与优化技巧,涵盖列表、集合、映射等常用数据结构,结合实际案例,指导开发者高效使用和优化Java集合。
43 4
|
2月前
|
Java
Java 8 引入的 Streams 功能强大,提供了一种简洁高效的处理数据集合的方式
Java 8 引入的 Streams 功能强大,提供了一种简洁高效的处理数据集合的方式。本文介绍了 Streams 的基本概念和使用方法,包括创建 Streams、中间操作和终端操作,并通过多个案例详细解析了过滤、映射、归并、排序、分组和并行处理等操作,帮助读者更好地理解和掌握这一重要特性。
37 2
|
2月前
|
存储 Java
判断一个元素是否在 Java 中的 Set 集合中
【10月更文挑战第30天】使用`contains()`方法可以方便快捷地判断一个元素是否在Java中的`Set`集合中,但对于自定义对象,需要注意重写`equals()`方法以确保正确的判断结果,同时根据具体的性能需求选择合适的`Set`实现类。
|
2月前
|
安全 Java
Java多线程集合类
本文介绍了Java中线程安全的问题及解决方案。通过示例代码展示了使用`CopyOnWriteArrayList`、`CopyOnWriteArraySet`和`ConcurrentHashMap`来解决多线程环境下集合操作的线程安全问题。这些类通过不同的机制确保了线程安全,提高了并发性能。
|
2月前
|
存储 Java 开发者
在 Java 中,如何遍历一个 Set 集合?
【10月更文挑战第30天】开发者可以根据具体的需求和代码风格选择合适的遍历方式。增强for循环简洁直观,适用于大多数简单的遍历场景;迭代器则更加灵活,可在遍历过程中进行更多复杂的操作;而Lambda表达式和`forEach`方法则提供了一种更简洁的函数式编程风格的遍历方式。