深入学习Java集合之ArrayList的实现原理

简介: 深入学习Java集合之ArrayList的实现原理

ArrayList 是List 接口的可变数组的实现,底层就是一个数组, 因此按序查找快, 乱序插入、删除因为涉及到后面元素移位所以性能慢。实现了所有可选列表操作,并允许包括 null 在内的所有元素。除了实现 List 接口外,此类还提供一些方法来操作内部用来存储列表的数组的大小。


每个ArrayList 实例都有一个容量,该容量是指用来存储列表元素的数组的大小。它总是至少等于列表的大小。随着向ArrayList 中不断添加元素,其容量也自动增长。自动增长会带来数据向新数组的重新拷贝,因此,如果可预知数据量的多少,可在构造ArrayList 时指定其容量。在添加大量元素前,应用程序也可以使用ensureCapacity 操作来增加ArrayList实例的容量,这可以减少递增式再分配的数量。


注意,此实现不是同步的。如果多个线程同时访问一个ArrayList 实例,而其中至少一个线程从结构上修改了列表,那么它必须保持外部同步。


【1】ArrayList 的实现

对于ArrayList 而言,它实现List 接口、底层使用数组保存所有元素。其操作基本上是对数组的操作,下面我们来分析ArrayList 的源代码。


其实现了RandomAccess 标明其是支持快速随机访问的。

public interface RandomAccess {
}


RandomAccess 内部是空的,标记“实现了这个接口的类支持快速(通常是固定时间)随机访问”。快速随机访问是什么意思呢?就是说不需要遍历,就可以通过下标(索引)直接访问到内存地址。

① 底层使用数组实现

//默认初始化容量,每次扩容1.5倍--new=1.5*old
private static final int DEFAULT_CAPACITY = 10;
//用于空实例的共享空数组实例
private static final Object[] EMPTY_ELEMENTDATA = {};
//共享空数组实例,用于默认大小的空实例。
//与EMPTY_ELEMENTDATA 区分开,以便了解添加第一个元素时需要扩容多少
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
//存储ArrayList的elements
transient Object[] elementData;
//ArrayList的size--包含的元素个数
private int size;
//数组分配最大值
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

② 构造方法


ArrayList 提供了三种方式的构造器,可以构造一个默认初始容量为10 的空列表、构造一个指定初始容量的空列表以及构造一个包含指定collection 的元素的列表,这些元素按照该collection 的迭代器返回它们的顺序排列的。

ArrayList 提供了三种方式的构造器,可以构造一个默认初始容量为10 的空列表、构造一个指定初始容量的空列表以及构造一个包含指定collection 的元素的列表,这些元素按照该collection 的迭代器返回它们的顺序排列的。
//构造

③ 存储

ArrayList 提供了set(int index, E element)、add(E e)、add(int index, E element)、 addAll(Collection<? extends E> c)、addAll(int index, Collection<? extends E> c)这些添加元素的方法。


3.1 set(int index, E element)

用指定的元素替代此列表中指定位置上的元素,并返回以前位于该位置上的元素。

public E set(int index, E element) {
    rangeCheck(index);
    E oldValue = elementData(index);
    elementData[index] = element;
    return oldValue;
}

rangeCheck(index)用来检查index是否合法

private void rangeCheck(int index) {
   if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

检查给定索引是否在范围内。如果不是,则抛出适当的运行时异常。此方法不检查索引是否为负:它总是在数组访问之前立即使用,如果索引为负,则会抛出ArrayIndexOutOfBoundsException。


3.2 add(E e)


将指定的元素添加到此列表的尾部,其中add方法内部的ensureCapacityInternal(size + 1)方法会使modCount++,这与failFast机制有关。


代码如下所示,size表示实际元素的个数elementData[size++] = e表示先往elementData[size]位置放上e元素,然后size+=1

public boolean add(E e) {
   // Increments modCount!!
    ensureCapacityInternal(size + 1); 
  //这里的size指的是列表中包含的元素个数
     elementData[size++] = e;
     return true;
 }

ensureCapacityInternal用来确保数组的大小,必要时会引起数组扩容。

private void ensureCapacityInternal(int minCapacity) {
  //如果底层数据为DEFAULTCAPACITY_EMPTY_ELEMENTDATA
  if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
  //将minCapacity 赋值为DEFAULT_CAPACITY和minCapacity中的大数
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    ensureExplicitCapacity(minCapacity);
}

ensureExplicitCapacity确保明确的容量,也就是判断minCapacity是否会导致扩容。如果会则触发grow引起扩容。

private void ensureExplicitCapacity(int minCapacity) {
  // modCount用来记录结构的改变,在fail-fast机制会用到
    modCount++;
    // overflow-conscious code
    //如果溢出了,则扩容数组
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

将modCount++,并判断底层数据的length与minCapacity大小,若elementData.length<minCapacity ,需要扩容。

grow(int minCapacity):

private void grow(int minCapacity) {
   // overflow-conscious code
   int oldCapacity = elementData.length;
//newCapacity =1.5*oldCapacity 
   int newCapacity = oldCapacity + (oldCapacity >> 1);
   //newCapacity 与minCapacity 比较
   if (newCapacity - minCapacity < 0)
       newCapacity = minCapacity;
       //newCapacity 与MAX_ARRAY_SIZE 比较
   if (newCapacity - MAX_ARRAY_SIZE > 0)
       newCapacity = hugeCapacity(minCapacity);
   // minCapacity is usually close to size, so this is a win:
   elementData = Arrays.copyOf(elementData, newCapacity);
   //Arrays.copyOf(elementData, newCapacity);将会使用newCapacity作为length创建一个
   //新数组,将elementData中元素拷贝过去,并将新数组赋值给elementData 
}

hugeCapacity是用来确定最大值的。如果容量大于MAX_ARRAY_SIZE那么就返回 Integer.MAX_VALUE,否则就采用MAX_ARRAY_SIZE。

private static int hugeCapacity(int minCapacity) {
   if (minCapacity < 0) // overflow
         throw new OutOfMemoryError();
         //如果minCapacity大于MAX_ARRAY_SIZE,则取  Integer.MAX_VALUE;
         //否则取MAX_ARRAY_SIZE
     return (minCapacity > MAX_ARRAY_SIZE) ?
         Integer.MAX_VALUE :MAX_ARRAY_SIZE;
}

3.3 add(int index, E element)

将指定的元素插入此列表中的指定位置。 如果当前位置有元素,则向右移动当前位于该位置的元素以及所有后续元素(将其索引加1)

public void add(int index, E element) {
    rangeCheckForAdd(index);
// Increments modCount!! 这个与上面一致
    ensureCapacityInternal(size + 1);  
    //数组拷贝,移动index及后续索引位置--index都+1
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
      //在原index位置处放上将要添加的元素
    elementData[index] = element;
    //将元素个数+1
    size++;
}

rangeCheckForAdd(int index)-检查索引:

private void rangeCheckForAdd(int index) {
   if (index > size || index < 0)
         throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

3.4 addAll(Collection<? extends E> c)

按照指定collection 的迭代器所返回的元素顺序,将该collection 中的所有元素添加到此列表的尾部。

public boolean addAll(Collection<? extends E> c) {
    Object[] a = c.toArray();
    int numNew = a.length;
    //如果数组length不够,则将会扩容
    ensureCapacityInternal(size + numNew);  // Increments modCount
    //数组拷贝
    System.arraycopy(a, 0, elementData, size, numNew);
    size += numNew;
    return numNew != 0;
}

3.5 addAll(int index, Collection<? extends E> c)

从指定的位置开始,将指定collection 中的所有元素插入到此列表中。

public boolean addAll(int index, Collection<? extends E> c) {
//索引检查
    rangeCheckForAdd(index);
    Object[] a = c.toArray();
    //需要拷贝元素的个数
    int numNew = a.length;
    //数组容量检查,如果数组length不够,则扩容
    ensureCapacityInternal(size + numNew);  // Increments modCount
    int numMoved = size - index;
    //判断是否插入中间,如果是则“先腾空间--将元素往后移动numNew个单位”
    if (numMoved > 0)
        System.arraycopy(elementData, index, elementData, index + numNew,
                         numMoved);
//将a中的元素从index=0开始拷贝到elementData中 index开始的位置
    System.arraycopy(a, 0, elementData, index, numNew);
    size += numNew;
    return numNew != 0;
}

④ 读取

返回此列表中指定位置上的元素

public E get(int index) {
    rangeCheck(index);
    return elementData(index);
}

⑤ 删除

ArrayList 提供了根据下标或者指定对象等几种方式的删除功能。


5.1 remove(int index)

移除此列表中指定位置上的元素

public E remove(int index) {
//检查索引
    rangeCheck(index);
    modCount++;
    E oldValue = elementData(index);
    int numMoved = size - index - 1;
//判断是移除中间还是末尾及以外的元素,如果是中间则进行数组拷贝--往前移动一个index单位
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
      //将原先列表末尾处元素赋值为null
    elementData[--size] = null; // clear to let GC do its work
    return oldValue;
}

5.2 remove(Object o)

移除此列表中首次出现的指定元素(如果存在)。这是因为ArrayList 中允许存放重复的元素。remove(Object o)是基于 fastRemove(index)进行元素移除的。

public boolean remove(Object o) {
//首先判断是否为null
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
      //遍历判断
        for (int index = 0; index < size; index++)
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    return false;
}

fastRemove(index):私有移除方法,与remove(int index)方法的区别是fastRemove(index)跳过边界检查且不返回 移除的值。

private void fastRemove(int index) {
//修改 modCount
    modCount++;
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--size] = null; // clear to let GC do its work
}

5.3 removeAll(Collection<?> c)

从列表中移除指定集合里面的元素,基于batchRemove(c, false)方法实现。

public boolean removeAll(Collection<?> c) {
     Objects.requireNonNull(c);
     return batchRemove(c, false);
 }

batchRemove(Collection<?> c, boolean complement)

private boolean batchRemove(Collection<?> c, boolean complement) {
        final Object[] elementData = this.elementData;
        int r = 0, w = 0;
        boolean modified = false;
        try {
            for (; r < size; r++)
            //判断Collection是否包含elementData[r],如果包含则进行下一轮判断;
            //否则将 r 位置元素 赋值给 w ,并将w+1;这个过程中w <= r。
                if (c.contains(elementData[r]) == complement)
                    elementData[w++] = elementData[r];
        } finally {
            // Preserve behavioral compatibility with AbstractCollection,
            // even if c.contains() throws.
            if (r != size) {
                System.arraycopy(elementData, r,
                                 elementData, w,
                                 size - r);
                w += size - r;
            }
            if (w != size) {
                // clear to let GC do its work
                //将w及以后的位置赋值为null
                for (int i = w; i < size; i++)
                    elementData[i] = null;
                modCount += size - w;
                size = w;
                modified = true;
            }
        }
        return modified;
    }

注意:从数组中移除元素的操作,也会导致被移除的元素以后的所有元素的向左移动一个位置。


⑥ trimToSize


ArrayList 还给我们提供了将底层数组的容量调整为当前列表保存的实际元素的大小的功能。它可以通过trimToSize 方法来实现。代码如下:

public void trimToSize() {
    modCount++;
    if (size < elementData.length) {
        elementData = (size == 0)
          ? EMPTY_ELEMENTDATA
          : Arrays.copyOf(elementData, size);
    }
}

注意:从数组中移除元素的操作,也会导致被移除的元素以后的所有元素的向左移动一个位置。


【2】Fail-Fast 机制


ArrayList 也采用了快速失败的机制,通过记录modCount 参数来实现。在面对并发的修改时,迭代器很快就会完全失败,而不是冒着在将来某个不确定时间发生任意不确定行为的风险。

通过上面源码分析可知,在添加、移除或者手动扩容时,都会导致modCount++。

目录
相关文章
|
11天前
|
Java API Maven
2025 Java 零基础到实战最新技术实操全攻略与学习指南
本教程涵盖Java从零基础到实战的全流程,基于2025年最新技术栈,包括JDK 21、IntelliJ IDEA 2025.1、Spring Boot 3.x、Maven 4及Docker容器化部署,帮助开发者快速掌握现代Java开发技能。
142 1
|
18天前
|
数据采集 搜索推荐 Java
Java 大视界 -- Java 大数据在智能教育虚拟学习环境构建与用户体验优化中的应用(221)
本文探讨 Java 大数据在智能教育虚拟学习环境中的应用,涵盖多源数据采集、个性化推荐、实时互动优化等核心技术,结合实际案例分析其在提升学习体验与教学质量中的成效,并展望未来发展方向与技术挑战。
|
25天前
|
存储 搜索推荐 安全
Java 大视界 --Java 大数据在智能教育学习效果评估与教学质量改进中的应用(209)
本文探讨了 Java 大数据在智能教育中的创新应用,涵盖学习效果评估、教学质量改进及个性化教学方案定制等内容,结合实战案例与代码解析,展现技术如何赋能教育智能化转型。
|
2月前
|
存储 缓存 NoSQL
java 集合入门基础理论的核心概念与实用长尾知识
本文介绍了Java集合框架的基础理论知识,包括单列集合(List、Set、Queue)和双列集合(Map)的特点及常用实现类(如ArrayList、HashSet、HashMap等)。详细讲解了集合的遍历方式(迭代器、增强for循环、Lambda表达式)和典型应用场景(如数据去重、键值存储等)。通过具体代码示例,帮助初学者理解集合框架的核心概念和实际应用,为Java编程中的数据存储与管理提供基础指导。
62 0
|
2月前
|
安全 Java API
Java 集合高级应用与实战技巧之高效运用方法及实战案例解析
本课程深入讲解Java集合的高级应用与实战技巧,涵盖Stream API、并行处理、Optional类、现代化Map操作、不可变集合、异步处理及高级排序等核心内容,结合丰富示例,助你掌握Java集合的高效运用,提升代码质量与开发效率。
171 0
|
2月前
|
存储 安全 Java
Java 学习路线 35 掌握 List 集合从入门到精通的 List 集合核心知识
本文详细解析Java中List集合的原理、常用实现类(如ArrayList、LinkedList)、核心方法及遍历方式,并结合数据去重、排序等实际应用场景,帮助开发者掌握List在不同业务场景下的高效使用,提升Java编程能力。
264 0
|
Java
Java面试题 synchronized底层实现原理?它与lock相比有什么优缺点?
Java面试题 synchronized底层实现原理?它与lock相比有什么优缺点?
315 0
|
2月前
|
安全 算法 Java
Java 多线程:线程安全与同步控制的深度解析
本文介绍了 Java 多线程开发的关键技术,涵盖线程的创建与启动、线程安全问题及其解决方案,包括 synchronized 关键字、原子类和线程间通信机制。通过示例代码讲解了多线程编程中的常见问题与优化方法,帮助开发者提升程序性能与稳定性。
106 0
|
2月前
|
Java API 调度
从阻塞到畅通:Java虚拟线程开启并发新纪元
从阻塞到畅通:Java虚拟线程开启并发新纪元
267 83

热门文章

最新文章