一. 简单认识集合框架
Java 集合框架 Java Collection Framework
,又被称为容器 container
,是定义在 java.util
包下的一组接口 interfaces
和其实现类 classes
。
其主要表现为将多个元素 element 置于一个单元中,用于对这些元素进行快速、便捷的存储 store 、检索 retrieve 、 管理 manipulate ,即平时我们俗称的增删查改 CRUD 。
例如,一副扑克牌(一组牌的集合)、一个邮箱(一组邮件的集合)、一个通讯录(一组姓名和电话的映射关系)等等。
Java的集合其实就是各种基本的数据结构(栈,队列,hash表等),基于业务需求进而演变出的Java特有的数据结构。
下图中列出了Java中常用集合的继承体系:
这些常见的集合(比如:rayList 顺序表, LinkedList 链表,stack 栈, queue 队列, priorityQueue 优先级队列(堆) 等)都需要我们去学习进而使用, 要想学会这些集合框架,需要我们学习其背后的数据结构知识。
二. 背后所涉及的数据结构和算法
1. 什么是数据结构
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的 集合。
数据结构可以理解为:数据 + 结构。数据是描述客观事物的符号,为程序操控,存储在计算机上,结构包括数据的逻辑结构和存储结构(物理结构)。
2. 什么是算法
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单 来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
3. 算法效率
算法效率分析分为两种:第一种是时间效率,第二种是空间效率。
时间效率被称为时间复杂度,而空间效率被称作 空间复杂度。 时间复杂度主要衡量的是一个算法的运行速度,而空间复杂度主要衡量一个算法所需要的额外空间,
在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计 算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
三. 时间复杂度
1. 时间复杂度的概念
时间复杂度的定义:
在计算机科学中,算法的时间复杂度是一个数学函数,它定量描述了该算法的运行时间。一个 算法执行所耗费的时间;
从论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道;
但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。
一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
2. 大O渐进表示法
实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。
大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法 :
用常数1取代运行时间中的所有加法常数。
在修改后的运行次数函数中,只保留最高阶项。
如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
递归
遵循上面计算大O阶的规则,递归的时间复杂度 = 递归的次数 * 每次递归执行的次数
算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界) 例
如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
3. 计算实例
- 【实例1】
请计算一下func1基本操作执行了多少次?并计算时间复杂度
void func1(int N){ int count = 0; for (int i = 0; i < N ; i++) { for (int j = 0; j < N ; j++) { count++; } } for (int k = 0; k < 2 * N ; k++) { count++; } int M = 10; while ((M--) > 0) { count++; } System.out.println(count); }
函数中有三个 for 循环,前两个循环是嵌套循环,所以在这两个循环中count++执行了 N ^ 2 次;
第三个 for 循环执行了 2 * N 次,最后一个 while 循环 执行了 10次.
所以 func1 基本操作执行次数 为: F(N) = N^2 + 2 * N + 10
根据上面推导大O阶的方法,最终可以得出 func1 的时间复杂度为 O(N^2)。
【实例2】
计算func2的时间复杂度?
void func2(int N) { int count = 0; for (int k = 0; k < 2 * N ; k++) { count++; } int M = 10; while ((M--) > 0) { count++; } System.out.println(count); }
基本操作执行了2N+10次,通过推导大O阶的方法得到时间复杂度为 O(N)
- 【实例3】
计算func3的时间复杂度?
void func3(int N, int M) { int count = 0; for (int k = 0; k < M; k++) { count++; } for (int k = 0; k < N ; k++) { count++; } System.out.println(count); }
基本操作执行了M+N次,有两个未知数M和N,时间复杂度为 O(N+M)
- 【实例4】
计算func4的时间复杂度?
void func4(int N) { int count = 0; for (int k = 0; k < 100; k++) { count++; } System.out.println(count); }
基本操作执行了100次,通过推导大O阶的方法,时间复杂度为 O(1)
- 【实例5】
计算bubbleSort的时间复杂度(最好和最坏)?
void bubbleSort(int[] array) { for (int i = 0; i < array.length-1; i++) { boolean sorted = true; for (int j = 0; j < array.length-1-i; i++) { if (array[j] > array[j+1]) { Swap(array, j, j+1); sorted = false; } } if (sorted == true) { break; } } } private void Swap(int[] array, int left, int right) { int tmp = array[left]; array[left] = array[right]; array[right] = tmp; }
最好 O(N) , 最坏:O(N ^2)
最好的情况,要排序的数组本来就是有序的,那么外层循环只会一次,而内层循环需要执行n次(array.length - 1);时间复杂度为O(N);
最坏的情况,数组是完全没有顺序的,那么外层循环会执行n次,内层循环的执行次数从n开始,每次比上一次少1, 是一个等差数列
基本操作执行最好N次,最坏执行了(1+N)*N/2次,通过推导大O阶的方法得出
时间复杂度为 O(N ^ 2) 。
- 【实例6】
计算binarySearch的时间复杂度(最好和最坏)?
基本操作执行最好N次,最坏执行了(1+N)*N/2次,通过推导大O阶的方法得出
时间复杂度为 O(N ^ 2) 。
- 【实例6】
计算binarySearch的时间复杂度(最好和最坏)?
int binarySearch(int[] array, int value) { int begin = 0; int end = array.length - 1; while (begin <= end) { int mid = begin + ((end-begin) / 2); if (array[mid] < value) begin = mid + 1; else if (array[mid] > value) end = mid - 1; else return mid; } return -1; }
基本操作执行最好1次,最坏logN次,时间复杂度为 O(logN)
ps: 在算法分析中表示是底数为2,对数为N,表示成logN。
二分查找每次排除掉一半的不适合值,一次二分剩下:n/2 两次二分剩下:n/2/2 = n/4;
2^x = n,x = logN,所以时间复杂度为 O(logN)
- 【实例7】
计算阶乘递归factorial的时间复杂度?
long factorial(int N) { return N < 2 ? N : factorial(N-1) * N; }
基本操作递归了N次,时间复杂度为O(N)。
- 【实例8】
计算斐波那契递归fibonacci的时间复杂度?
int fibonacci(int N) { return N < 2 ? N : fibonacci(N-1)+fibonacci(N-2);
要注意计算时间复杂度并不一定是去精确计算基本操作的执行次数,可以看到在上图中会有缺的一块,但并不影响时间复杂度的计算,这里的计算只是为了对此时的递归算法的运行时间有一个总体了解和考量; 所以上面的递归算法可以认为基本操作递归了 2 ^ N 了次,时间复杂度为 O(2 ^ N)。
四. 空间复杂度
1. 介绍
空间复杂度是对一个算法在运行过程中临时占用存储空间大小的量度 。
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义;
事实上,对算法的空间复杂度影响最大的,往往是程序运行过程中所申请的临时存储空间,不同的算法所编写出的程序,其运行时申请的临时存储空间通常会有较大不同;
所以空间复杂度算的是程序运行时临时变量的个数(随着程序规模的不同在变化);空间复杂度计算规则基本跟时间复杂度类似,也使用大O渐进表示法。
2. 计算实例
- 【实例1】
计算bubbleSort的空间复杂度?
void bubbleSort(int[] array) { for (int i = 0; i < array.length-1; i++) { boolean sorted = true; for (int j = 0; j < array.length-1-i; i++) { if (array[j] > array[j+1]) { Swap(array, j, j+1); sorted = false; } } if (sorted == true) { break; } } } private void Swap(int[] array, int left, int right) { int tmp = array[left]; array[left] = array[right]; array[right] = tmp; }
使用了常数个额外空间,所以空间复杂度为 O(1)
- 【实例2】
计算fibonacci的空间复杂度?
long[] fibonacci1(int n) { long[] fibArray = new long[n + 1]; //随着n的变化,所申请的临时空间大小也会变化 fibArray[0] = 0; fibArray[1] = 1; for (int i = 2; i <= n ; i++) { fibArray[i] = fibArray[i - 1] + fibArray [i - 2]; } return fibArray; }
动态开辟了N个空间,空间复杂度为 O(N)
- 【实例3】
计算阶乘递归Factorial的空间复杂度?
long factorial1(int N) { return N < 2 ? N : factorial1(N-1)*N; }
递归调用了N次每次调用参数会压栈开辟临时空间,开辟了N个栈帧,每个栈帧使用了常数个空间(压栈);所以空间复杂度为O(N)
- 【实例4】
计算斐波那契递归fibonacci的空间复杂度?
int fibonacci(int N) { return N < 2 ? N : fibonacci(N-1)+fibonacci(N-2); }
观察上面给出的图进行分析,每次递归都会开辟对应的栈帧并将参数压栈,这里需要注意的是每次递归调用结束之后,相应的栈帧空间会被销毁释放,不计入空间复杂度中;
上图中标注的地方为例可以看到,当一次递归又分出两次递归调用时,只有左边的调用结束返回后才回执行右边的调用;
所以图中递归的每一层其实最终只有一个栈帧空间,所以求第n个斐波那契数的递归深度为n,也就是开辟了n个栈帧,
每次递归的栈帧空间大小都是一样的,所以每次递归中需要的空间是一个常量,并不会随着n的变化而变化,每次递归的空间复杂度就是O(1);
开辟了N个栈帧,每个栈帧使用了常数个空间累加,空间复杂度为O(N) 。