Java集合体系总结

简介: 一、集合框架集合是容纳数据的容器,java常用的集合体系图如下。以集合中是否运行重复元素来分,主要有List和Set接口,List集合中可以有重复元素,Set集合集合中的元素不可重复,Iterator和List Iterator是遍历集合的2个迭代器,Map是存储Key/Value键值对的容器。

一、集合框架

集合是容纳数据的容器,java常用的集合体系图如下。以集合中是否运行重复元素来分,主要有List和Set接口,List集合中可以有重复元素,Set集合集合中的元素不可重复,Iterator和List Iterator是遍历集合的2个迭代器,Map是存储Key/Value键值对的容器。

这里写图片描述

java集合体系图

二、迭代器

迭代器的用法写在后面,这里说明Iterator和ListIterator的区别:

  1. Iterator在遍历一个集合的过程中不能修改集合中的对象,ListIterator可以修改对象
  2. ListIterator从后往前遍历,有hasPrevious()方法,Iterator没有
  3. ListIterator可以在遍历过程中进行添加元素操作,Iterator不能,否则会报java.util.ConcurrentModificationException异常。

三、List集合

List集合存储不唯一、有序的对象,可以操作角标。

3.1 ArrayList

3.1.1内部实现

ArrayList也叫变长数组,数组的长度是固定的,ArrayList可以随着元素的增多长度增加,内部实现为数组。ArrayList在添加元素时首先会判断长度,长度不够时,长度扩展到原来到1.5倍,原数组复制到新数组。

3.1.2关键属性

属性 取值或结论
是否允许重复 允许
是否有序 有序
是否允许为空 允许
是否线程安全
使用场景 多查询、少增删

3.1.3 测试示例

创建一个ArrayList对象,添加5个元素,其中一个为null:

        arrayList.add("a1");
        arrayList.add("a2");
        arrayList.add(null);
        arrayList.add("a3");
        arrayList.add("a4");
        System.out.println(arrayList);

打印结果:

[a1, a2, null, a3, a4]

使用迭代器for循环方式遍历:

        for (Iterator iter=arrayList.iterator();iter.hasNext();){
            System.out.println(iter.next());
        }

使用迭代器while循环方式遍历:

        Iterator iter=arrayList.iterator();
        while (iter.hasNext()){
            System.out.println(iter.next());
        }

存储自定义对象:

public class Boy {

    private String name;
    private int age;
    //省略setter、getter、构造器和toString()方法
}

添加Boy对象到ArrayList中并打印:

 ArrayList<Boy> boys=new ArrayList<>();

        Boy b1=new Boy("Tom",12);
        Boy b2=new Boy("Jack",11);
        Boy b3=new Boy("Mike",15);

        boys.add(b1);
        boys.add(b2);
        boys.add(b3);

        System.out.println(boys);
        Iterator<Boy> iter=boys.iterator();
        while (iter.hasNext()){
            Boy b=iter.next();
            System.out.println(b.getName()+"----"+b.getAge());
        }

结果:

[Boy{name='Tom', age=12}, Boy{name='Jack', age=11}, Boy{name='Mike', age=15}]
Tom----12
Jack----11
Mike----15

3.1.4 转成线程安全

非线程安全的ArrayList

ArrayList<String> arrayList = new ArrayList();

线程安全的ArrayList

List arrayList =Collections.synchronizedList(new ArrayList<String>()) ;

3.1.5 常用方法

  • clear():移除列表中的所有元素
  • contains(Object o): 包含指定元素
  • get(int index):返回列表中指定位置上的元素
  • indexOf(Object o): 返回列表中首次出现指定元素的索引,如果列表不包含,则返回-1
  • isEmpty():列表为空返回true
  • lastIndexOf(Object o):返回列表中最后一次出现指定元素的索引,如果列表不包含元素则返回-1
  • remove(int index):移除列表中指定位置的元素
  • remove(Object o):移除列表中首次出现的指定元素
  • removeRange(int fromIndex,int toIndex):移除列表中索引在fromIndex(包括)和toIndex(不包括)之间的所有元素。
  • size():返回集合的元素个数
  • set(int index,E element):修改指定位置上的元素
  • toArray():按顺序返回包含此列表中所有元素的数组

3.2 LinkedList

3.2.1内部实现

内部实现为双向链表,删除和增加速度快,查找速度慢。

3.2.2关键属性

属性 取值或结论
是否允许重复 允许
是否有序 有序
是否允许为空 允许
是否线程安全
使用场景 多增删、少查询

3.2.3 测试示例

LinkedList当作FIFO的队列使用,也就是常用的add方法添加元素:

        LinkedList quene=new LinkedList();
        quene.add("a");
        quene.add("b");
        quene.add("c");
        quene.add("d");

        System.out.println("打印队列:"+quene);
        System.out.println("获取队头:"+quene.getFirst());
        System.out.println("获取队尾:"+quene.getLast());
        System.out.println("移除队头:"+quene.pop());
        System.out.println("移除队头之后的队列:"+quene);

打印结果:

打印队列:[a, b, c, d]
获取队头:a
获取队尾:d
移除队头:a
移除队头之后的队列:[b, c, d]

LinkedList当作FILO的栈使用:

        LinkedList stack = new LinkedList();

        stack.push("1");
        stack.push("2");
        stack.push("3");
        stack.push("4");

        System.out.println("打印栈:"+stack);

        System.out.println("获取栈顶元素:"+stack.peek());
        System.out.println("打印栈:"+stack);
        System.out.println("取出栈顶元素:"+stack.pop());
        System.out.println("打印栈:"+stack);

打印结果:

打印栈:[4, 3, 2, 1]
获取栈顶元素:4
打印栈:[4, 3, 2, 1]
取出栈顶元素:4
打印栈:[3, 2, 1]

除了ArrayList中包含的基本方法以为,LinkedList中多了getFirst()、getLast()、addFirst()、addLast()、peek()、peekFirst()、peekLast()、removeFirst()、removeLast()等方法。

3.2.4 转成线程安全

 List<Integer> linkedList=Collections.synchronizedList(new LinkedList<Integer>());

3.3 Vector

Vector内部是数组结构,线程安全,速度较慢,几乎不用。

四、Set集合

Set集合中的元素唯一、无序,没有角标。

4.1HashSet

4.1.1内部实现

内部结构是哈希表,对象存入HashSet之前,要先确保对象重写equals()和hashCode()方法,这样才能比较对象的值是否相等,确保set中没有存储相同的对象。判断两个元素是否相同,首先通过hashCode()方法判断的是2个元素的哈希值是否相同,再根据equals()方法判断值是否相同,只有2者都相同才是统一元素。

4.1.2 基本属性

属性 取值或结论
是否允许重复 不允许
是否有序 无序
是否允许为空 允许(只有一个null)
是否线程安全
使用场景 对象不重复和需要快速查找的场景

4.1.3 测试示例

        HashSet<String> hashSet=new HashSet();
        hashSet.add("abc");
        hashSet.add("张三");
        hashSet.add("李四");
        hashSet.add("tim");
        hashSet.add(null);
        hashSet.add(null);

        System.out.println("HashSet 大小:"+hashSet.size());
        Iterator iter=hashSet.iterator();
        while (iter.hasNext()){
            System.out.println(iter.next());
        }

打印结果:

HashSet 大小:5
null
李四
张三
abc
tim

添加自定义对象,仍然添加Boy类中的对象

      Boy b1=new Boy("神乐",12);
      Boy b2=new Boy("神乐",12);
      HashSet<Boy> boys=new HashSet<>();
      boys.add(b1);
      boys.add(b2);
      System.out.println(boys);

结果:

[Boy{name='神乐', age=12}, Boy{name='神乐', age=12}]

这时候b1和b2其实是一个对象,在Boy类中重写hashCode()和equals()方法:

public class Boy {

    private String name;
    private int age;
    //省略setter、getter、构造器和toString()方法
        @Override
    public int hashCode() {

        return name.hashCode()+age;
    }

    @Override
    public boolean equals(Object obj) {
        if (this==obj) return  true;
        if (!(obj instanceof Boy))  throw new ClassCastException("类型错误");
        Boy boy=(Boy) obj;

        return this.name.equals(boy.name)&&(this.age==boy.age);
    }
}

重写equals和hashCode方法以后,上述集合中就会只添加一个对象:

[Boy{name='神乐', age=12}]

4.1.4 转成线程安全

Set<String> hSet=Collections.synchronizedSet(new HashSet<String>());

4.1.5 唯一且有序

LinkedHashSet集合中都元素唯一且有序,这里都有序是指添加顺序。

        LinkedHashSet<String> lHashSet= new LinkedHashSet<String>();
        lHashSet.add("abc");
        lHashSet.add("张三");
        lHashSet.add("李四");
        lHashSet.add("tim");
        lHashSet.add(null);
        iter=lHashSet.iterator();
        while (iter.hasNext()){
            System.out.println(iter.next());
        }

打印结果:

abc
张三
李四
tim
null

4.2 TreeSet

4.2.1 内部实现

TreeSet内部实现为二叉树,可以对元素进行排序

4.2.2 基本属性

属性 取值或结论
是否允许重复 不允许
是否有序 无序
是否允许为空 允许(只有一个null)
是否线程安全
使用场景 去重且排序

4.2.3 测试示例


        Boy b1=new Boy("定春",16);
        Boy b2=new Boy("神乐",12);
        Boy b3=new Boy("桑巴",13);

        TreeSet<Boy> treeSet=new TreeSet<>(new Comparator<Boy>() {
            @Override
            public int compare(Boy o1, Boy o2) {
                return o1.getAge()-o2.getAge();
            }
        });

        treeSet.add(b1);
        treeSet.add(b2);
        treeSet.add(b3);
        System.out.println(treeSet);

打印结果:

[Boy{name='神乐', age=12}, Boy{name='桑巴', age=13}, Boy{name='定春', age=16}]

4.2.4 转成线程安全

        TreeSet<Boy> treeSet=new TreeSet<>(new Comparator<Boy>() {
            @Override
            public int compare(Boy o1, Boy o2) {
                return o1.getAge()-o2.getAge();
            }
        });

        Set<Boy> treeSet1=Collections.synchronizedSet(treeSet);

五、Map集合

Map只存储的是键值对,Key必须唯一且不为空,key允许为null。

5.1HashMap

5.1.1基本属性

属性 取值或结论
是否允许重复 key重复会被覆盖,value可重复
是否有序 无序
是否允许为空 key和value都允许为空
是否线程安全

5.1.2 测试示例

词频统计:

        String[] arr={"Hadoop","Lucene","ES","ES","ES","Hadoop","Java","JS"};
        //TreeMap<String,Integer> map=new TreeMap<>();
        HashMap<String,Integer> map=new HashMap<>();
        for (String str:arr){
            if (map.containsKey(str)){
                map.put(str,map.get(str)+1);
            }else{
                map.put(str,1);
            }
        }

        Set<String> keys=map.keySet();
        Iterator<String> iter=keys.iterator();
        while (iter.hasNext()){
            String str=iter.next();
            System.out.println(str+"---"+map.get(str));
        }

打印结果:

Java---1
Hadoop---2
JS---1
Lucene---1
ES---3

如果想按value排序,可以改成TreeMap();

六、性能对比

ArrayList遍历性能对比

ArrayList的遍历可以用一般for循环、foreach循环、Iterator迭代器三种方式实现,为了测试它们的性能,先创建一个ArrayList对象,添加5万个字符串:

ArrayList<String > a = new ArrayList();
for (int i = 0; i < 60000; i++) {
    a.add(""+i);
}

for 循环打印并记录耗时:

long start = System.currentTimeMillis();

for (int i = 0; i < a.size(); i++) {
     System.out.print(a.get(i));
}

long end = System.currentTimeMillis();

System.out.println("\n下标for循环:" + (end - start));

结果:

150

foreach循环打印并记录耗时:

 start = System.currentTimeMillis();

 for (String i : a) {
      System.out.print(i);
 }
 end = System.currentTimeMillis();

 System.out.println("\nforeach:" + (end - start));

耗时:

95

Iterator循环打印:

start=System.currentTimeMillis();
Iterator iter=a.iterator();
while (iter.hasNext()){
     System.out.print(iter.next());
}
end=System.currentTimeMillis();
System.out.println("\nIter:"+(end-start));

耗时:

60

结论:一般for 循环最慢、foreach次之、Iterator最快。

另外,Iterator遍历还有另外一种变形方式,效率和while形式一样。

for(Iterator it=a.iterator();it.hasNext();){
    System.out.print(it.next());
}

七、参考文章

有些文章总结的很好,列出来供参考学习:
Java集合框架

目录
相关文章
|
17天前
|
存储 Java
深入探讨了Java集合框架中的HashSet和TreeSet,解析了两者在元素存储上的无序与有序特性。
【10月更文挑战第16天】本文深入探讨了Java集合框架中的HashSet和TreeSet,解析了两者在元素存储上的无序与有序特性。HashSet基于哈希表实现,添加元素时根据哈希值分布,遍历时顺序不可预测;而TreeSet利用红黑树结构,按自然顺序或自定义顺序存储元素,确保遍历时有序输出。文章还提供了示例代码,帮助读者更好地理解这两种集合类型的使用场景和内部机制。
33 3
|
17天前
|
存储 Java 数据处理
Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位
【10月更文挑战第16天】Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位。本文通过快速去重和高效查找两个案例,展示了Set如何简化数据处理流程,提升代码效率。使用HashSet可轻松实现数据去重,而contains方法则提供了快速查找的功能,彰显了Set在处理大量数据时的优势。
27 2
|
2天前
|
存储 Java
判断一个元素是否在 Java 中的 Set 集合中
【10月更文挑战第30天】使用`contains()`方法可以方便快捷地判断一个元素是否在Java中的`Set`集合中,但对于自定义对象,需要注意重写`equals()`方法以确保正确的判断结果,同时根据具体的性能需求选择合适的`Set`实现类。
|
2天前
|
存储 Java 开发者
在 Java 中,如何遍历一个 Set 集合?
【10月更文挑战第30天】开发者可以根据具体的需求和代码风格选择合适的遍历方式。增强for循环简洁直观,适用于大多数简单的遍历场景;迭代器则更加灵活,可在遍历过程中进行更多复杂的操作;而Lambda表达式和`forEach`方法则提供了一种更简洁的函数式编程风格的遍历方式。
|
2天前
|
Java 开发者
|
14天前
|
安全 Java 程序员
深入Java集合框架:解密List的Fail-Fast与Fail-Safe机制
本文介绍了 Java 中 List 的遍历和删除操作,重点讨论了快速失败(fail-fast)和安全失败(fail-safe)机制。通过普通 for 循环、迭代器和 foreach 循环的对比,详细解释了各种方法的优缺点及适用场景,特别是在多线程环境下的表现。最后推荐了适合高并发场景的 fail-safe 容器,如 CopyOnWriteArrayList 和 ConcurrentHashMap。
43 5
|
15天前
|
安全 Java 程序员
Java集合之战:ArrayList vs LinkedList,谁才是你的最佳选择?
本文介绍了 Java 中常用的两个集合类 ArrayList 和 LinkedList,分析了它们的底层实现、特点及适用场景。ArrayList 基于数组,适合频繁查询;LinkedList 基于链表,适合频繁增删。文章还讨论了如何实现线程安全,推荐使用 CopyOnWriteArrayList 来提升性能。希望帮助读者选择合适的数据结构,写出更高效的代码。
43 3
|
17天前
|
Java 开发者
在Java集合世界中,Set以其独特的特性脱颖而出,专门应对重复元素
在Java集合世界中,Set以其独特的特性脱颖而出,专门应对重复元素。通过哈希表和红黑树两种模式,Set能够高效地识别并拒绝重复元素的入侵,确保集合的纯净。无论是HashSet还是TreeSet,都能在不同的场景下发挥出色的表现,成为开发者手中的利器。
24 2
|
1天前
|
存储 Java 开发者
Java中的集合框架深入解析
【10月更文挑战第32天】本文旨在为读者揭开Java集合框架的神秘面纱,通过深入浅出的方式介绍其内部结构与运作机制。我们将从集合框架的设计哲学出发,探讨其如何影响我们的编程实践,并配以代码示例,展示如何在真实场景中应用这些知识。无论你是Java新手还是资深开发者,这篇文章都将为你提供新的视角和实用技巧。
6 0
|
6天前
|
Java API Apache
java集合的组内平均值怎么计算
通过本文的介绍,我们了解了在Java中计算集合的组内平均值的几种方法。每种方法都有其优缺点,具体选择哪种方法应根据实际需求和场景决定。无论是使用传统的循环方法,还是利用Java 8的Stream API,亦或是使用第三方库(如Apache Commons Collections和Guava),都可以有效地计算集合的组内平均值。希望本文对您理解和实现Java中的集合平均值计算有所帮助。
14 0