前言
大家好哦,《C语言从0到1》系列博客已经更新完毕,如有需要,请自行前往博主页面进行翻看即可。接下来,进入我们的数据结构阶段。博主将更新数据结构阶段的系列的博客,由浅到深,同时,中间会穿插题目的练习,记录自己的学习过程以及分享所学知识,一起加油进步吧💖
数据结构与算法
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。
通俗简单理解数据结构就是在内存中管理数据。
这里有一个要注意的点:数据结构和数据库的区别是什么❓
本质都是在管理数据,数据结构是在内存中管理数据,而数据库是在磁盘中管理数据(主要都是增删查改)磁盘可以不带电存储
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
算法其实我们很早就接触了,比如去排序一组数据,冒泡、快速等等,还有查找,遍历二分查找等等。简单来说,算法就是对数据进行处理,提高效率等等。
那么问题来了:
如何学好数据结构和算法
死磕代码,磕成这样就可以了:
沉迷学习,日渐消瘦!
注意画图和思考,画图能够很好地帮助我们理解,理清楚逻辑。
多加刷题(学习的数据结构与算法的过程中我们应该多去刷题,提高自己的编程能力,不然只能像我一样,只是一个菜鸟)
算法效率
如何衡量一个算法的好坏呢?比如对于以下斐波那契数列 :
long long Fib(int N) { if(N < 3) return 1; return Fib(N-1) + Fib(N-2); }
代码行数小?效率就高???那该如何衡量其好与坏呢
算法的复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
所以我们需要去理解时间复杂度和空间复杂度
时间复杂度
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。 下面,我们来进行练习一下:
// 请计算一下Func1中++count语句总共执行了多少次? void Func1(int N) { int count = 0; for (int i = 0; i < N ; ++ i) { for (int j = 0; j < N ; ++ j) { ++count; } } for (int k = 0; k < 2 * N ; ++ k) { ++count; } int M = 10; while (M--) { ++count; } printf("%d\n", count); }
Func1 执行的基本操作次数 :F(N) = N^2+2*N+10
- N = 10 F(N) = 130
- N = 100 F(N) = 10210
- N = 1000 F(N) = 1002010
实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。
大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶
使用大O的渐进表示法以后,Func1的时间复杂度为 😮(N^2)
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数
另外有些算法的时间复杂度存在最好、平均和最坏情况:
- 最坏情况:任意输入规模的最大运行次数(上界)
- 平均情况:任意输入规模的期望运行次数
- 最好情况:任意输入规模的最小运行次数(下界)
我们不妨举个例子:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
对于时间复杂度至此我们有了充分的理解,下面我们通过几个例子来计算时间复杂度:
// 计算Func2的时间复杂度? void Func2(int N) { int count = 0; for (int k = 0; k < 2 * N ; ++ k) { ++count; } int M = 10; while (M--) { ++count; } printf("%d\n", count); } //基本操作执行了2N+10次,通过推导大O阶方法知道,时间复杂度为 O(N) // 计算Func3的时间复杂度? void Func3(int N, int M) { int count = 0; for (int k = 0; k < M; ++ k) { ++count; } for (int k = 0; k < N ; ++ k) { ++count; } printf("%d\n", count); } //基本操作执行了M+N次,有两个未知数M和N,时间复杂度为 O(N+M) // 计算Func4的时间复杂度? void Func4(int N) { int count = 0; for (int k = 0; k < 100; ++ k) { ++count; } printf("%d\n", count); } //基本操作执行了100次,通过推导大O阶方法,时间复杂度为 O(1) // 计算strchr的时间复杂度? const char * strchr ( const char * str, int character ); //基本操作执行最好1次,最坏N次,时间复杂度一般看最坏,时间复杂度为 O(N) // 计算BubbleSort的时间复杂度? void BubbleSort(int* a, int n) { assert(a); for (size_t end = n; end > 0; --end) { int exchange = 0; for (size_t i = 1; i < end; ++i) { if (a[i-1] > a[i]) { Swap(&a[i-1], &a[i]); exchange = 1; } } if (exchange == 0) break; } } //基本操作执行最好N次,最坏执行了等差数列求和(N*(N+1)/2次,通过推导大O阶方法+时间复杂度一般看最坏,时间复杂度为 O(N^2) // 计算BinarySearch的时间复杂度? int BinarySearch(int* a, int n, int x) { assert(a); int begin = 0; int end = n-1; // [begin, end]:begin和end是左闭右闭区间,因此有=号 while (begin <= end) { int mid = begin + ((end-begin)>>1); if (a[mid] < x) begin = mid+1; else if (a[mid] > x) end = mid-1; else return mid; } return -1; } //基本操作执行最好1次,最坏O(logN)次,时间复杂度为 O(logN) ps:logN在算法分析中表示是底数为2,对数为N。有些地方会写成lgN // 计算阶乘递归Fac的时间复杂度? long long Fac(size_t N) { if(0 == N) return 1; return Fac(N-1)*N; } //通过计算分析发现基本操作递归了N次,时间复杂度为O(N)。 // 计算斐波那契递归Fib的时间复杂度? long long Fib(size_t N) { if(N < 3) return 1; return Fib(N-1) + Fib(N-2); } //通过计算分析发现,成等比数列,进行求和,基本操作递归了2^N次,时间复杂度为O(2^N)。
空间复杂度
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。
空间复杂度计算规则基本跟时间复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
// 计算BubbleSort的空间复杂度? void BubbleSort(int* a, int n) { assert(a); for (size_t end = n; end > 0; --end) { int exchange = 0; for (size_t i = 1; i < end; ++i) { if (a[i-1] > a[i]) { Swap(&a[i-1], &a[i]); exchange = 1; } } if (exchange == 0) break; } } //使用了常数个额外空间,所以空间复杂度为 O(1) // 计算Fibonacci的空间复杂度? // 返回斐波那契数列的前n项 long long* Fibonacci(size_t n) { if(n==0) return NULL; long long * fibArray = (long long *)malloc((n+1) * sizeof(long long)); fibArray[0] = 0; fibArray[1] = 1; for (int i = 2; i <= n ; ++i) { fibArray[i] = fibArray[i - 1] + fibArray [i - 2]; } return fibArray; } //动态开辟了N个空间,空间复杂度为 O(N) // 计算阶乘递归Fac的空间复杂度? long long Fac(size_t N) { if(N == 0) return 1; return Fac(N-1)*N; } //递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间。空间复杂度为O(N)
常见复杂度对比
OJ练习题
消失的数字
解题思路:所有数相加和减去当前数和就是那个所缺的数
int missingNumber(int* nums, int numsSize){ int sum = 0; for(int i = 0;i<numsSize;i++) { sum+=nums[i]; } int ret = 0; for(int i = 0;i<=numsSize;i++) { ret+=i; } return ret-sum; }
轮转数组
思路一:存放最右边的数,一次右移一个,需要移动K%numsSize次
void rotate(int* nums, int numsSize, int k){ if (k > numsSize) { k %= numsSize; } for (int i = 0; i < k; i++) { int tmp = nums[numsSize - 1]; for (int j = numsSize - 1; j >= 1; j--) { nums[j] = nums[j - 1]; } nums[0] = tmp; } }
但是 可以发现运行超时:
思路二:开辟一个新的数组存放需要移动的数,在把剩余的数存放到新的数组中,最后把新数组中的数字赋值给原来的数组
void rotate(int* nums, int numsSize, int k) { if (k >= numsSize) { k %= numsSize; } int* arr = (int*)malloc(sizeof(int) * (numsSize+1)); for (int i = 0; i <k; i++) { arr[k-i-1] = nums[numsSize - i-1]; } for (int i = k; i < numsSize; i++) { arr[i] = nums[i-k]; } for(int i = 0;i<numsSize;i++) { nums[i] = arr[i]; } }
思路三:前n-k个逆置,后k个逆置,整体逆置
void right_move(int arr[], int left, int right) { while (left < right) { int tmp = arr[left]; arr[left] = arr[right]; arr[right] = tmp; ++left; --right; } } void rotate(int* nums, int numsSize, int k) { if (k >= numsSize) { k %= numsSize; } right_move(nums, 0, numsSize - 1 - k); right_move(nums, numsSize - k, numsSize - 1); right_move(nums, 0, numsSize - 1); }