【数据结构】算法的时间复杂度和空间复杂度

简介: 【数据结构】算法的时间复杂度和空间复杂度

1. 什么是数据结构?

数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。

2.什么是算法?

算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。

3.算法效率

  • 通常我们会用复杂度去衡量一个算法的好坏。算法在编写成可执行程序后,运行时需要消耗时间资源和空间资源(内存资源)。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
  • 时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法的运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小,所以对空间复杂度要求很高,但是现在随着计算机行业的快速发展,计算机的存储容量已经达到了很高的程度,内存成本逐渐降低。所以我们如今已经不再需要特别关心一个算法的空间复杂度。

4.时间复杂度

4.1时间复杂度的概念

定义:

 在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所消耗的时间,从理论上来说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要算法都上机测试嘛?是可以都上机测试,但是这很麻烦,并且同一个程序在不同的机器上运行时间可能差异很大,所以我们有了时间复杂度的分析方法。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作执行的次数,为算法的时间复杂度。

 即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。

4.2大O的渐进表示法

实际中我们计算时间复杂度的时候其实并不需要计算精确的执行次数,而只需要知道大概执行次数,所以这里我们引入了大O的渐进表示法。其中大O符号是用于描述函数渐进行为的数学符号。

推导大O阶的方法:

  1. 用常数1取代运行时间中的所有加法常数
  2. 在修改后的运行次数函数中,只保留最高阶项
  3. 如果最高阶项存在且系数是不唯1的常系数,则去除最高项的系数,得到的结果就是大O阶
  4. 如果最终结果是O(1),则表示常数次,并不是代表一次
  • 最坏情况
     任意输入规模的最大运行次数(上界)
  • 平均情况
     任意输入规模的期望运行次数
  • 最好情况
     任意输入规模的最小运行次数(下界)

 一般我们比较关心的是一个算法的最坏情况

4.3常见时间复杂度计算举例

4.3.1冒泡排序:

// 计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
  assert(a);
  for (size_t end = n; end > 0; --end)
  {
    int exchange = 0;
    for (size_t i = 1; i < end; ++i)
    {
      if (a[i - 1] > a[i])
      {
        Swap(&a[i - 1], &a[i]);
        exchange = 1;
      }
    }
    if (exchange == 0)
      break;//如果没有条语句,最好情况也是O(N*N)
  }
}
  • 最好情况:O(N)
  • 最坏情况:O(N^2)

 最好情况就是数组本身有序,虽然它有序,但是计算机最初并不知道它是有序的,仍需要遍历一遍数组才能知道它是有序的,因此冒泡排序的最好情况是:O(N)

 冒泡排序一趟可以排好一个元素,最坏情况是数组完全逆序,则第一趟需要交换N − 1 N-1N−1次,第二趟需要交换N − 2 N-2N−2次…直到最后一趟只交换一次,把所有的交换次数加起来就得到了冒泡排序最坏情况下的时间复杂度,其实也就是一个等差数列求和,所以最会情况下的时间复杂度是O(N^2)

4.3.2二分查找

// 计算BinarySearch的时间复杂度?
int BinarySearch(int* a, int n, int x)
{
  assert(a);
  int begin = 0;
  int end = n - 1;
  // [begin, end]:begin和end是左闭右闭区间,因此有=号
  while (begin <= end)
  {
    int mid = begin + ((end - begin) >> 1);
    if (a[mid] < x)
      begin = mid + 1;
    else if (a[mid] > x)
      end = mid - 1;
    else
      return mid;
  }
  return -1;
}
  • 最好情况:O(1)
  • 最坏情况:O(log2N)

最好情况是第一次查找就找到目标值,此时时间复杂度就是O(1)

 二分查找中每一次查找要么找到目标值,要么可以排除掉一半数据,因此最坏情况是执行到当区间只剩下一个值的时候,用数学语言来描述这个过程就是:每折半查找一次就会除一次二,一直到结果为1 11的时候,二分查找结束。N / 2 / 2 / 2..... / 2 = 1。计算执行次数就是看除了多少次2。其结果是除了log2N个2,所以最坏情况就是O(log2N),一般可以把简写成O(logN)(仅限于时间复杂度,且只有当底数是2的时候才能简化)

O(N)与O(log2N)的对比:

可见O(log2N)相较于O(N)在效率上有很大的提升,虽然二分查找的效率很高,但是他有一个致命的限制条件就是数组有序,对数组排序也是需要消耗时间的,因此二分查找在实际中使用的并不是很多,用的更多的是红黑树,它的时间复杂度也是O(log2N)

4.3.3递归阶乘

// 计算阶乘递归Fac的时间复杂度?
long long Fac(size_t N)
{
  if (0 == N )
    return 1;
  return Fac(N - 1) * N;
}
  • 时间复杂度:O(N)

 这里涉及到了递归,Fac一共被递归调用了N次,且每一次Fac中的执行次数是1,所以总的执行次数就是N + 1 N+1N+1个1 11相加,因此时间复杂度就是O ( N ) O(N)O(N)

4.3.4斐波那契数列

// 计算斐波那契递归Fib的时间复杂度?
long long Fib(size_t N)
{
  if (N < 3)
    return 1;
  return Fib(N - 1) + Fib(N - 2);
}
  • 时间复杂度:O(2^N)

用递归去求解斐波那契额数列,它的时间复杂度是等比数列求和,最终的时间复杂度就是 O(2^N)

常见时间复杂度关系

4.4例题:消失的数字

在线OJ:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台

分析:

 这道题大家很容易想到的方法就是先对数组进行排序然后再利用二分查找找到缺失的数字。但是注意题目限制了时间复杂度只能在O(N),而我们常用的冒泡排序时间复杂度是O(N^2),快排的时间复杂度是O(N∗ logN) ,都不符合题目要求,因此这条路要被我们Pass掉。我们可以考虑异或来解决这个问题,异或有下面两条性质:a^a=0、a^0=a,并且异或满足交换律和结合律,所以我们可以先让0~N的所有数字进行异或,然后再和数组里面的所有元素进行异或,最终的结果就是缺失的那个数字,这种方法只需要遍历两边数组,时间复杂度是O(N)。下面来看一下这种思路的代码实现:

int missingNumber(int* nums, int numsSize){
    int num = 0;
    for(int i = 0; i <= numsSize; i++)
    {
        num = num ^ i;
    }
    for(int i = 0; i < numsSize; i++)
    {
        num = num ^ nums[i];
    }
    return num;
}

处理上面的这种思路还可以直接利用求和公式算出0~N的总和,再减去数组中的所有元素,最终的结果就是缺失的数字,此种方法只需要遍历一遍数组,因此时间复杂度也是O(N)。

5.空间复杂度

5.1空间复杂度的概念

定义:

 空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度。空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度的计算规则和时间复杂度类似,也采用大O渐进表示法。

 注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。

 一般常见的空间复杂度都是O(1)或者O(N)(额外开辟数组)。

5.2常见空间复杂度计算举例

5.2.1递归阶乘

// 计算阶乘递归Fac的空间复杂度?
long long Fac(size_t N)
{
    if(N == 0)
        return 1;
    return Fac(N-1)*N;
}

首先每调用一次函数都会创建一个函数栈帧,而每个函数的空间复杂度可以看作是O ( 1 ) O(1)O(1),一共递归调用了N+1次Fac函数,因此空间复杂度是O ( N ) O(N)O(N)。 这里调用的N+1次Fac函数栈帧的地址是不同的,因为它们是递归调用的。

 

void Fun1()
{
  int a = 0;
  printf("%p\n", &a);
}
void Fun2()
{
  int b = 0;
  printf("%p\n", &b);
}
int main()
{
  Fun1();
  Fun2();
  return 0;
}

程序先调用Fun1函数,创建其相应的函数栈帧,调用结束的时候函数栈帧会被销毁,也就是把空间还给操作系统,接下来调用Fun2函数,创建其相应的函数栈帧,这也就是为什么两次打印的地址是一样的,因为Fun1调用结束的时候把空间还给了操作系统。

void Fun1()
{
  int a = 0;
  printf("%p\n", &a);
}
void Fun2()
{
  int b = 0;
  printf("%p\n", &b);
  Fun1();
}
int main()
{
  Fun2();
  return 0;
}

此时两次打印的地址不同,因为是在Fun2函数中调用的Fun1函数,它的执行过程是:先在主函数中调用Fun2函数,创建相应的函数栈帧,接着在Fun2函数中调用了Fun1函数,所以接下来会去创建Fun1的函数栈帧,这就是为什么两次打印的地址不同,函数的递归调用就是类似这样。

5.2.2斐波那契数

// 计算斐波那契递归Fib的空间复杂度?
long long Fib(size_t N)
{
  if (N < 3)
    return 1;
  return Fib(N - 1) + Fib(N - 2);
}

与普通递归不同的是,这里一次函数调用中会再递归调用两次,具体的调用过程以及调用次序如上图所示,第四次调用结束后函数栈指会销毁,接着进行第五次函数调用,因此第四次调用与第五次调用所创建的函数栈帧其实是同一块,同理第三次和第六次函数调用所创建的函数栈帧也是同一块。综上所述,当求N的斐波那契数列时,一共只会占用N − 1个函数栈帧的空间,因为有很多函数栈帧的创建用的是同一块空间,因此递归求解斐波那契数列的空间复杂度是O(N),这也说明时间一去不复返,而空间可以重复利用。

5.3例题:轮转数组

这道题可以采用暴力求解的方法,即一次旋转一个数字然后轮转k次,但这样做的时间复杂度O(N^2),对于这种轮转问题我们可以采用下面时间复杂度为O(N),空间复杂度是O(1)的三步来解决:

  1. 前n-k个逆置
  2. 后k个逆置
  3. 整体逆置
void rotate(int* nums, int numsSize, int k){
    k = k % numsSize;//一定要记得模,这样可以节约时间还可以避免越界
    int i = 0;
    int j = 0;
    int tmp = 0;
    for (i = 0, j = numsSize - k - 1; i < j; i++,j--)//对前n-k个进行逆置
    {
        tmp = nums[i];
        nums[i] = nums[j];
        nums[j] = tmp;
    }
    for (i = numsSize - k, j = numsSize - 1; i < j; i++, j--)//对后k个进行逆置
    {
        tmp = nums[i];
        nums[i] = nums[j];
        nums[j] = tmp;
    }
    for (i = 0, j = numsSize - 1; i < j; i++, j--)//对整体进行逆置
    {
        tmp = nums[i];
        nums[i] = nums[j];
        nums[j] = tmp;
    }
}

针对上面这个题我们还可以采用以空间换时间的办法,即新创建一个数组把原数组的后k个拷贝到新数组的前面,再把原数组的前n-k个拷贝到新数组的后面:

void rotate(int* nums, int numsSize, int k)
{
    k %= numsSize;
    int* arr = (int*)malloc(sizeof(int)*numsSize);
    memcpy(arr, nums+(numsSize-k), sizeof(int)*k);
    memcpy(arr+k, nums, sizeof(int)*(numsSize-k));
    memcpy(nums, arr, sizeof(int)*numsSize);
    free(arr);
}

此时的时间复杂度是O ( N ) O(N)O(N),表面上我们看着时间复杂度像是O(1),但其实并不是,因为memcpy函数内部是一个字节一个字节进行拷贝的,它的时间复杂度是O(N),由于新开了一个数组,所以空间复杂度也是O(N)。

本次的内容到这里就结束啦。希望大家阅读完可以有所收获,同时也感谢各位读者三连支持。文章有问题可以在评论区留言,博主一定认真认真修改,以后写出更好的文章。你们的支持就是博主最大的动力。

相关文章
|
3天前
|
机器学习/深度学习 存储 算法
数据结构与算法 动态规划(启发式搜索、遗传算法、强化学习待完善)
数据结构与算法 动态规划(启发式搜索、遗传算法、强化学习待完善)
11 1
|
7天前
|
搜索推荐 C语言
【C语言/数据结构】排序(归并排序|计数排序|排序算法复杂度)
【C语言/数据结构】排序(归并排序|计数排序|排序算法复杂度)
11 0
|
7天前
【数据结构】二叉树-堆(top-k问题,堆排序,时间复杂度)
【数据结构】二叉树-堆(top-k问题,堆排序,时间复杂度)
16 4
|
7天前
|
存储 算法
Leetcode 30天高效刷数据结构和算法 Day1 两数之和 —— 无序数组
给定一个无序整数数组和目标值,找出数组中和为目标值的两个数的下标。要求不重复且可按任意顺序返回。示例:输入nums = [2,7,11,15], target = 9,输出[0,1]。暴力解法时间复杂度O(n²),优化解法利用哈希表实现,时间复杂度O(n)。
19 0
|
14天前
|
存储 机器学习/深度学习 算法
|
2天前
|
算法 数据安全/隐私保护 计算机视觉
基于二维CS-SCHT变换和LABS方法的水印嵌入和提取算法matlab仿真
该内容包括一个算法的运行展示和详细步骤,使用了MATLAB2022a。算法涉及水印嵌入和提取,利用LAB色彩空间可能用于隐藏水印。水印通过二维CS-SCHT变换、低频系数处理和特定解码策略来提取。代码段展示了水印置乱、图像处理(如噪声、旋转、剪切等攻击)以及水印的逆置乱和提取过程。最后,计算并保存了比特率,用于评估水印的稳健性。
|
3天前
|
存储 算法 数据可视化
基于harris角点和RANSAC算法的图像拼接matlab仿真
本文介绍了使用MATLAB2022a进行图像拼接的流程,涉及Harris角点检测和RANSAC算法。Harris角点检测寻找图像中局部曲率变化显著的点,RANSAC则用于排除噪声和异常点,找到最佳匹配。核心程序包括自定义的Harris角点计算函数,RANSAC参数设置,以及匹配点的可视化和仿射变换矩阵计算,最终生成全景图像。
|
3天前
|
算法 Serverless
m基于遗传优化的LDPC码NMS译码算法最优归一化参数计算和误码率matlab仿真
MATLAB 2022a仿真实现了遗传优化的归一化最小和(NMS)译码算法,应用于低密度奇偶校验(LDPC)码。结果显示了遗传优化的迭代过程和误码率对比。遗传算法通过选择、交叉和变异操作寻找最佳归一化因子,以提升NMS译码性能。核心程序包括迭代优化、目标函数计算及性能绘图。最终,展示了SNR与误码率的关系,并保存了关键数据。
12 1
|
5天前
|
算法 调度
考虑需求响应的微网优化调度模型【粒子群算法】【matlab】
考虑需求响应的微网优化调度模型【粒子群算法】【matlab】
|
5天前
|
运维 算法
基于改进遗传算法的配电网故障定位(matlab代码)
基于改进遗传算法的配电网故障定位(matlab代码)