时间复杂度空间复杂度
0.数据结构介绍及磁盘特点
0.1 数据结构和数据库的区别
0.2 磁盘特点
1. 算法效率
1.1 如何衡量一个算法的好坏
1.2 算法的复杂度
1.3 算法复杂度在校招中的考察
2. 时间复杂度
2.1 时间复杂度的概念
2.2 大O的渐进表示法
2.3 常见时间复杂度计算举例
3. 空间复杂度
4. 常见复杂度对比
5. 总结:
0.数据结构介绍及磁盘特点
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。
0.1 数据结构和数据库的区别
数据库和数据结构都是在管理数据(增删查改),区别是管理的位置不同。
数据量非常大–>在磁盘中管理,用数据库
数据量相对较小–>数据结构
0.2 磁盘特点
磁盘可以不带电存储,内存不能。
当文件没有进行保存时,这个文件保留在内存中,一旦断电,文件将无法保存,因此为了避免这种情况的发生,,处理文件之后,应该及时的ctrl+s保存到磁盘当中去。
1. 算法效率
1.1 如何衡量一个算法的好坏
如何衡量一个算法的好坏呢? 比如对于以下斐波那契数列:
long long Fib(int N) { if(N < 3) return 1; return Fib(N-1) + Fib(N-2); }
斐波那契数列的递归方式非常简洁,但简洁一定好吗?那该如何衡量其好坏呢?
- 不一定,斐波那契数列递归展开后,运用等比求和,其时间复杂度为O(2^n),这是一个非常大的数字。‘
1.2 算法的复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度,所以我们如今已经不需要再特别关注一个算法的空间复杂度。
1.3 算法复杂度在校招中的考察
2. 时间复杂度
2.1 时间复杂度的概念
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个
分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
- 即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
// 请计算一下Func1中++count语句总共执行了多少次? void Func1(int N) { int count = 0; for (int i = 0; i < N ; ++ i) { for (int j = 0; j < N ; ++ j) { ++count; } } for (int k = 0; k < 2 * N ; ++ k) { ++count; } int M = 10; while (M--) { ++count; } printf("%d\n",count); }
Func1执行的基本操作次数:
F ( N ) = N 2 + 2 ∗ N + 10 F(N) = N² + 2*N +10
F(N)=N
2+2∗N+10
N = 10 ,F(N) = 30
N = 100 ,F(N) = 10210
N = 1000 ,F(N) = 1002010
实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法
2.2 大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
- 1.用常数1取代运行时间中的所有加法常数。
- 2.在修改后的运行次数函数中,只保留最高阶项。
- 3.如果最高阶项存在且不是1,则去除与这个项目相乘的常数。
使用大O渐进法表示以后,Func1的时间复杂度为:
O ( N 2 ) O(N²)
O(N 2 )
N = 10 ,F(N) = 100
N = 100 ,F(N) = 10000
N = 1000,F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项 ,简洁明了的表示出了执行次数。
另外有些算法的时间复杂度存在最好、平均和最坏情况:
- 最坏情况:任意输入规模的最大运行次数(上界)
- 平均情况:任意输入规模的期望运行次数
- 最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
- 最好情况:1次找到
- 最坏情况:N次找到
- 平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
2.3 常见时间复杂度计算举例
实例1:
// 计算Func2的时间复杂度? void Func2(int N) { int count = 0; for (int k = 0; k < 2 * N ; ++ k) { ++count; } int M = 10; while (M--) { ++count; } printf("%d\n", count); }
实例1基本操作执行了2N+10次,通过推导大O阶方法知道,时间复杂度为 O(N)。
实例2:
// 计算Func3的时间复杂度? void Func3(int N, int M) { int count = 0; for (int k = 0; k < M; ++ k) { ++count; } for (int k = 0; k < N ; ++ k) { ++count; } printf("%d\n", count); }
实例2基本操作执行了M+N次,有两个未知数M和N,时间复杂度为 O(N+M)。
当然,通过 比较M和N的大小 我们也可以将其细化:
- M>>N : O(M)
- N>>M : O(N)
- M与N差不多相同 : O(M)或O(N)
实例3:
// 计算Func4的时间复杂度? void Func4(int N) { int count = 0; for (int k = 0; k < 100; ++ k) { ++count; } printf("%d\n", count); }
实例3基本操作执行了常数次,通过推导大O阶方法,时间复杂度为 O(1)。
当然这里或许会有小伙伴怀疑,那一亿次也是常数次吗?答案是肯定的,由于CPU的运行速度非常快,一亿次会在1s之内完成,因此,只要是常数次,都能看成O(1)。
实例4:
// 计算strchr的时间复杂度? const char * strchr ( const char * str, int character );
这与strstr函数(字符串函数介绍中提到)只有2个字符的区别,strstr中s意味着字符串查找,那么strchr代表字符查找,即在主串中查找特定字符在不在主串中。
实例4基本操作执行最好1次,最坏N次,时间复杂度一般看最坏,时间复杂度为 O(N).
实例5:
// 计算BubbleSort的时间复杂度? void BubbleSort(int* a, int n) { assert(a); for (size_t end = n; end > 0; --end) { int exchange = 0; for (size_t i = 1; i < end; ++i) { if (a[i-1] > a[i]) { Swap(&a[i-1], &a[i]); exchange = 1; } } if (exchange == 0) break; } }
实例5基本操作执行最好N次,最坏执行了(N*(N+1)/2次,通过推导大O阶方法+时间复杂度一般看最坏,时间复杂度为 O(N^2).
当然,此冒泡排序是经过优化的,多了一个判别,即当本身是有序的时候,就不继续交换,直接跳出这个循环。但在没有优化冒泡排序的逻辑中执行,无论如何他也不会执行N次,而是只执行(N*(N+1)/2次。
实例6:
// 计算BinarySearch的时间复杂度? int BinarySearch(int* a, int n, int x) { assert(a); int begin = 0; int end = n-1; // [begin, end]:begin和end是左闭右闭区间,因此有=号 while (begin <= end) { int mid = begin + ((end-begin)>>1); if (a[mid] < x) begin = mid+1; else if (a[mid] > x) end = mid-1; else return mid; } return -1; }
实例6基本操作执行最好1次,最坏O(logN)次,时间复杂度为 O(logN) ps:logN在算法分析中表示是底数为2,对数为N。有些地方会写成lgN。
对于二分查找,相信大家都很熟悉,二分查找是基于有序的前提之下进行的查找算法。其在有序数组的中间开始进行查找,通过不断的缩小范围对想进行查找的单位进行精准的定位,当这个范围左右区间开始交错,那么这个循环结束,标志着没有找到此位置。
即我们的查找过程 : N/2, N/4, N/8 , …… , 2 , 1。
假设我们查找了x次,那么:N/2^x = 1,即:
x=log2N
实例7:
// 计算阶乘递归Fac的时间复杂度? long long Fac(size_t N) { if(0 == N) return 1; return Fac(N-1)*N; }
实例7通过计算分析发现基本操作递归了N次,时间复杂度为O(N)。
当我们稍作改动:
long long Fac(size_t N) { if(0 == N) return 1; for(size_t i=0;i<N;i++) { printf("%d\n",i); } return Fac(N-1)*N; }
从没改动的逻辑计算:1+1+1+1+……+1(n次)变成了1 * n + 1 * (n-1) + 1 * (n-2) +……+1 * 2 + 1 * 1,即时间复杂度为: n*(n+1)/2.
实例8:
// 计算斐波那契递归Fib的时间复杂度? long long Fib(size_t N) { if(N < 3) return 1; return Fib(N-1) + Fib(N-2); }
实例8可以大约看成二叉树的遍历,即每一层的次数为:从高到低1->2->4->8->2*n,这样等比数列求和,求得大约递归了 2^n 次,即时间复杂度为O(2^N)。
3. 空间复杂度
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。
空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
实例1:
// 计算BubbleSort的时间复杂度 void BubbleSort(int* a,int n) { assert(a); for (size_t end = n; end > 0; --end) { int exchange = 0; for (size_t i = 1; i < end; ++i) { if (a[i-1] > a[i]) { Swap(&a[i-1], &a[i]); exchange = 1; } } if (exchange == 0) break; } }
实例1实际上只开辟了三个临时变量,为常数个,因此空间复杂度为O(1)。
实例2:
// 计算Fibonacci的空间复杂度? // 返回斐波那契数列的前n项 long long* Fibonacci(size_t n) { if(n==0) return NULL; long long * fibArray = (long long *)malloc((n+1) * sizeof(long long)); fibArray[0] = 0; fibArray[1] = 1; for (int i = 2; i <= n ; ++i) { fibArray[i] = fibArray[i - 1] + fibArray [i - 2]; } return fibArray; }
实例2在堆空间开辟了n+1个空间,由于空间是复用的,使用次数不会改变空间复杂度的大小,因此空间复杂度为O(N)。
实例3:
// 计算阶乘递归Fac的空间复杂度? long long Fac(size_t N) { if(N == 0) return 1; return Fac(N-1)*N; }
实例三是递归调用,递归算法的空间复杂度实际上是递归的深度,每递归一次创建一次栈帧,每个栈帧使用常数个空间,因此递归N次,空间复杂度为O(N)。
4. 常见复杂度对比
一般算法常见的复杂度如下:
5201314 | O(1) | 常数阶 |
3n+4 | O(n) | 线性阶 |
3n^2+4n+5 | O(n^2) | 平方阶 |
3log(2)n+4 | O(logn) | 对数阶 |
2n+3nlog(2)n+14 | O(nlogn) | nlogn阶 |
n3+2n2+4n+6 | O(n^3) | 立方阶 |
2^n | O(2^n) | 指数阶 |
5. 总结:
以上需要注意的地方是时间复杂度的计算并不是简单的看循环次数,而是要根据具体的逻辑来进行计算,就比如希尔排序运用了三层循环,但是他的速度比冒泡的速度快很多,因此,要记住具体问题具体分析!