说在整个初阶数据结构开头
数据结构其实也学了挺长时间了,说着是要刷题所以才没怎么去写关于数据结构方面的内容。数据结构作为计算机中及其重要的一环,如果不趁着假期系统整理一下着实可惜,我这里构想的是将初阶数据结构和高阶数据结构,分别分成两个部分,初阶数据结构呢,大概有以下内容
- 本篇:导论,算法的时间复杂度和空间复杂度
- 线性表专题---顺序表
- 线性表专题---单链表(不带头双向不循环链表)
- 线性表专题---双向链表(带头双向循环链表)
- 栈和队列
- 二叉树和堆
- 排序专题
后期会根据具体内容拆分修改
初阶数据结构中我会用C语言来实现不同的结构
在高阶数据结构中,将会用C++来介绍二叉搜索树,AVL树,红黑树,哈希等
到这里,不再废话,就开始今天的内容吧!
数据结构是什么?
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。
算法是什么?
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
算法的时间复杂度和空间复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
时间复杂度
1.时间复杂度的定义
在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法的用时随数据规模而增长的趋势,即 时间复杂度
//计算以下Fun1中++count执行了多少次? void Fun1() { int count = 0; for(int i = 0;i < N; i++){ for(int j = 0;j < N;j++) ++count; } for(int t = 0;t < 2 * N; t++) ++count; int digit = 10; while(digit--) ++count; }
如果聪明的你稍加计算,便可以得出
F(N) = N^2 + 2 * N + 10
在实际计算复杂度时,我们并不需要真的计算出精确的执行次数,而只需要大概的执行次数,这里我们使用大O的渐进表示法。
2.大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶规则:
- 用常数1取代运行时间中的所有加法常数
- 在修改后的运行次数函数中,只保留最高阶项
- 如果最高阶项存在且不是1,则去除与这个项目相乘的常数
最后得到的就是大O阶
我们上方的F(N)最后用大O表示法计算所得结果为:
O(N ^ 2)
当F(N) = N^2 + 2 * N + 10时
当O(N ^ 2)时
通过上面的对比,我们可以发现,运用大O表示法,随着运算的数据量不断增大,大O表示法其实是去掉了F(N)中对结果影响不大的项,同时简介明了的表明了随着数据量增大执行次数的增长曲线
另外算法的时间复杂度还存在最好,平均和最坏的情况:
- 最坏情况:任意输入规模的最大运行次数(上界)
- 平均情况:任意输入规模的期望运行次数
- 最好情况:任意输入规模的最小运行次数(下界)
这里可以举个例子,比如在一个长度为N的数组中搜索一个数据x
- 最好情况:一次找到
- 最坏情况:N次找到
- 平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
3.例题,计算时间复杂度
例题1:
// 计算Func2的时间复杂度? void Func2(int N) { int count = 0; for (int k = 0; k < 2 * N ; ++ k){ ++count; } int M = 10; while (M--){ ++count; } printf("%d\n", count); }
例题1中,计算可知F(N) = 2N + 10,通过大O阶方法可知,时间复杂度为O(N)
例题2:
// 计算Func3的时间复杂度? void Func3(int N, int M) { int count = 0; for (int k = 0; k < M; ++k) { ++count; } for (int k = 0; k < N; ++k) { ++count; } printf("%d\n", count); }
例题2中,可知F(N) = N + M,有两个未知数M和N,时间复杂度这时为O(N + M)
例题3:
// 计算Func4的时间复杂度? void Func4(int N) { int count = 0; for (int k = 0; k < 100; ++k) { ++count; } printf("%d\n", count); }
例题3中,执行操作数不会随N的变化而改变,通过推导大O阶方法,时间复杂度为O(N)
例题4:
// 计算Func5的时间复杂度? // 其中a是一个指向数组首元素的指针 // n是数组大小 // x是要在数组中查找的元素 int Func5(int* a, int n,int digit) { int i; for (i = 0; i < n; i++) { if (a[i] == digit)break; } return i; }
例题4中,基本操作执行最好1次,最坏N次,时间复杂度一般看最坏,时间复杂度为 O(N)
例题5:
// 计算BubbleSort的时间复杂度? void BubbleSort(int* a, int n) { assert(a); for (size_t end = n; end > 0; --end) { int exchange = 0; for (size_t i = 1; i < end; ++i) { if (a[i - 1] > a[i]) { Swap(&a[i - 1], &a[i]); exchange = 1; } } if (exchange == 0) break; } }
例题5中,基本操作执行最好N次,最坏执行了(N*(N+1))/2次,通过推导大O阶方法+时间复杂度一般看最坏,时间复杂度为 O(N^2)
例题6:
// 计算BinarySearch(二分查找)的时间复杂度? int BinarySearch(int* a, int n, int x) { assert(a); int begin = 0; int end = n - 1; // [begin, end]:begin和end是左闭右闭区间,因此有=号 while (begin <= end) { int mid = begin + ((end - begin) >> 1); if (a[mid] < x) begin = mid + 1; else if (a[mid] > x) end = mid - 1; else return mid; } return -1; }
例题6中,基本操作执行最好1次,最坏O(logN)次,时间复杂度为 O(logN) 。logN在算法分析中表示是底数为2,对数为N。有些地方会写成lgN。
例题7:
// 计算阶乘递归Fac的时间复杂度? long long Fac(size_t N) { if (0 == N) return 1; return Fac(N - 1) * N; }
例题7中,通过计算分析发现基本操作递归了N次,时间复杂度为O(N)。
例题8:
// 计算斐波那契递归Fib的时间复杂度? long long Fib(size_t N) { if (N < 3) return 1; return Fib(N - 1) + Fib(N - 2); }
例题8中,通过计算分析发现基本操作递归了2^N次,时间复杂度为O(2^N)。
最后其实我们计算递归的次数,就是计算2^0 + 2^1 + 2^2 ……+2^(N-1),我们可以通过等比数列计算公式求解,最终可得时间复杂度为O(2^N)。其实这个斐波那契数列的递归图并不是一个完美的等腰三角形,上图三角形的阴影部分其实是实际缺失的,不过这部分在巨大的数据中显得微不足道,于是就被忽略了。
空间复杂度
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用额外存储空间大小的量度
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
例题
例题1:
在时间复杂度例题5,BubbleSort的空间复杂度,使用了常数个额外空间,所以空间复杂度为O(1)
例题2:
// 计算Fibonacci的空间复杂度? // 返回斐波那契数列的前n项 long long* Fibonacci(size_t n) { if (n == 0) return NULL; long long* fibArray = (long long*)malloc((n + 1) * sizeof(long long)); fibArray[0] = 0; fibArray[1] = 1; for (int i = 2; i <= n; ++i) { fibArray[i] = fibArray[i - 1] + fibArray[i - 2]; } return fibArray; }
例题2开辟了n个空间,空间复杂度为O(N)
例题3:
// 计算阶乘递归Fac的空间复杂度? long long Fac(size_t N) { if (N == 0) return 1; return Fac(N - 1) * N; }
例题3递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间。空间复杂度为O(N)
常见复杂度对比图
结语
关于时间时间复杂度和空间复杂度的内容到这里就结束了,本篇博客做的内容主要是后期数据结构内容的一个结构框定以及数据结构与算法的引入。如果大家觉得对更多数据结构内容感兴趣的话,还请多多关注我后期的博客,感谢大家的支持,比心---♥