数据结构从入门到精通——算法的时间复杂度和空间复杂度

本文涉及的产品
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 算法的时间复杂度和空间复杂度是评估算法性能的两个重要指标。时间复杂度主要关注算法执行过程中所需的时间随输入规模的变化情况,而空间复杂度则关注算法执行过程中所需的最大存储空间或内存空间。

算法的时间复杂度和空间复杂度


前言

算法的时间复杂度和空间复杂度是评估算法性能的两个重要指标。时间复杂度主要关注算法执行过程中所需的时间随输入规模的变化情况,而空间复杂度则关注算法执行过程中所需的最大存储空间或内存空间。

对于时间复杂度,它通常表示为一个大O表示法,如O(n)O(n^2)O(log n)等,其中n代表输入规模的大小。一个优秀的算法应该具有较低的时间复杂度,这意味着当输入规模增大时,算法的执行时间增长不会过快。例如,线性时间复杂度O(n)的算法在处理大规模数据时比二次时间复杂度O(n^2)的算法更加高效。

空间复杂度同样重要,它决定了算法执行过程中需要占用的内存空间。在某些情况下,空间复杂度甚至比时间复杂度更加关键,特别是在资源受限的环境中,如嵌入式系统或移动设备。因此,设计算法时需要在时间和空间之间做出权衡,以达到最佳的整体性能。

为了优化算法的时间复杂度和空间复杂度,开发者通常会采用一系列策略,如使用更高效的数据结构、减少不必要的计算、利用缓存机制等。此外,对于某些特定问题,还可以采用特定的算法设计技巧,如分治法、动态规划、贪心算法等,来降低算法的时间复杂度和空间复杂度。

需要注意的是,算法的时间复杂度和空间复杂度并不是绝对的评估标准。在实际应用中,还需要考虑算法的其他因素,如可读性、可维护性、可扩展性等。因此,在设计和选择算法时,需要综合考虑多个因素,以找到最适合特定应用场景的算法。

综上所述,算法的时间复杂度和空间复杂度是评估算法性能的关键指标。通过优化这两个指标,我们可以提高算法的执行效率,减少资源消耗,从而在实际应用中取得更好的效果。


一、算法效率

算法效率是评价一个算法性能优劣的重要指标,它决定了算法在处理大规模数据或复杂问题时所需的时间和空间资源。在信息技术迅猛发展的今天,算法效率的提升对于解决实际问题、提高软件性能、优化用户体验等方面都具有深远的意义。

一个高效的算法往往能够在较短的时间内完成计算任务,减少用户等待的时间,提升系统的响应速度。在数据处理领域,比如大数据分析、机器学习等,算法效率的高低直接关系到数据处理的速度和质量。一个高效的算法能够在短时间内处理大量数据,提取出有价值的信息,为决策提供有力支持。

除了时间效率,算法的空间效率同样重要。在资源有限的硬件环境下,算法的空间复杂度决定了程序能够处理的数据规模和复杂度。一个空间效率高的算法能够在有限的内存空间中处理更多数据,避免因为内存不足而导致的程序崩溃或性能下降。

在实际应用中,算法效率的提升往往需要通过算法优化和创新来实现。算法优化包括改进现有算法的实现方式、减少不必要的计算、利用并行计算等技术提高计算效率等。算法创新则是在原有算法的基础上进行突破,开发出全新的算法来解决传统算法无法高效处理的问题。

算法效率的提升对于整个信息技术领域都有着深远的影响。它不仅能够提高软件系统的性能和稳定性,还能够推动相关领域的技术进步和创新。随着算法研究的不断深入和发展,相信未来会有更多高效、实用的算法问世,为我们的生活和工作带来更多的便利和可能性。

1.1 如何衡量一个算法的好坏

如何衡量一个算法的好坏呢?比如对于以下斐波那契数列:

long long Fib(int N)
{
   if(N < 3)
   return 1;
   return Fib(N-1) + Fib(N-2);
}

斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?

1.2 算法的复杂度

算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。

时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。

二、时间复杂度

2.1 时间复杂度的概念

时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。

即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。

// 请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
  int count = 0;
  for (int i = 0; i < N ; ++ i)
  {
    for (int j = 0; j < N ; ++ j)
     {
       ++count;
     }
  }
 
  for (int k = 0; k < 2 * N ; ++ k)
  {
     ++count;
  }
 
  int M = 10;
  while (M--)
  {
     ++count;
  }
  printf("%d\n", count);
}

Func1 执行的基本操作次数 :

  • N = 10 F(N) = 130
  • N = 100 F(N) = 10210
  • N = 1000 F(N) = 1002010

实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。

2.2 大O的渐进表示法

大O符号(Big O notation):是用于描述函数渐进行为的数学符号。

推导大O阶方法:

  1. 用常数1取代运行时间中的所有加法常数。
  2. 在修改后的运行次数函数中,只保留最高阶项。
  3. 如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。

使用大O的渐进表示法以后,Func1的时间复杂度为:

  • N = 10 F(N) = 100
  • N = 100 F(N) = 10000
  • N = 1000 F(N) = 1000000

通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。

另外有些算法的时间复杂度存在最好、平均和最坏情况:

  • 最坏情况:任意输入规模的最大运行次数(上界)
  • 平均情况:任意输入规模的期望运行次数
  • 最好情况:任意输入规模的最小运行次数(下界)

例如:在一个长度为N数组中搜索一个数据x

  • 最好情况:1次找到
  • 最坏情况:N次找到
  • 平均情况:N/2次找到

在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)

2.3常见时间复杂度计算举例

实例1:

// 计算Func2的时间复杂度?
void Func2(int N)
{
  int count = 0;
  for (int k = 0; k < 2 * N ; ++ k)
  {
    ++count;
  }
 
  int M = 10;
  while (M--)
  {
    ++count;
  }
 
   printf("%d\n", count);
}

实例2:

// 计算Func3的时间复杂度?
void Func3(int N, int M)
{
   int count = 0;
   for (int k = 0; k < M; ++ k)
   {
     ++count;
   }
 
  for (int k = 0; k < N ; ++ k)
  {
    ++count;
  }
  printf("%d\n", count);
}

实例3:

// 计算Func4的时间复杂度?
void Func4(int N)
{
  int count = 0;
  for (int k = 0; k < 100; ++ k)
  {
    ++count;
  }
  printf("%d\n", count);
}

实例4:

// 计算strchr的时间复杂度?
const char * strchr ( const char * str, int character );

实例5:

// 计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
  assert(a);
  for (size_t end = n; end > 0; --end)
   {
     int exchange = 0;
     for (size_t i = 1; i < end; ++i)
    {
      if (a[i-1] > a[i])
      {
        Swap(&a[i-1], &a[i]);
        exchange = 1;
      }
    }
 
    if (exchange == 0)
       break;
   }
}

实例6:

// 计算BinarySearch的时间复杂度?
int BinarySearch(int* a, int n, int x)
{
   assert(a);
 
   int begin = 0;
  int end = n-1;
 // [begin, end]:begin和end是左闭右闭区间,因此有=号
   while (begin <= end)
  {
    int mid = begin + ((end-begin)>>1);
     if (a[mid] < x)
       begin = mid+1;
     else if (a[mid] > x)
      end = mid-1;
    else
      return mid;
  }
 
  return -1;
}

实例7:

// 计算阶乘递归Fac的时间复杂度?
long long Fac(size_t N)
{
   if(0 == N)
    return 1;
 
   return Fac(N-1)*N;
}

实例8:

// 计算斐波那契递归Fib的时间复杂度?
long long Fib(size_t N)
{
   if(N < 3)
     return 1;
 
   return Fib(N-1) + Fib(N-2);
}

实例答案及分析:

  1. 实例1基本操作执行了2N+10次,通过推导大O阶方法知道,时间复杂度为 O(N)
  2. 实例2基本操作执行了M+N次,有两个未知数M和N,时间复杂度为 O(N+M)
  3. 实例3基本操作执行了10次,通过推导大O阶方法,时间复杂度为 O(1)
  4. 实例4基本操作执行最好1次,最坏N次,时间复杂度一般看最坏,时间复杂度为 O(N)
  5. 实例5基本操作执行最好N次,最坏执行了(N*(N+1)/2次,通过推导大O阶方法+时间复杂度一般看最坏,时间复杂度为 O(N^2)
  6. 实例6基本操作执行最好1次,最坏O(logN)次,时间复杂度为 O(logN)
    ps:logN在算法分析中表示是底数为2,对数为N。有些地方会写成lgN
  7. 实例7通过计算分析发现基本操作递归了N次,时间复杂度为O(N)
  8. 实例8通过计算分析发现基本操作递归了2^N次,时间复杂度为O(2^N)

2.4等差数列计算公式

等差数列的计算公式是:

第n项: an = a1 + (n-1)d

其中,an表示第n项,a1表示首项,d表示公差。

等差数列求和公式如下:

Sn = (n/2)(2a + (n - 1)d)
Sn = (n/2)(a1 + an)

其中Sn表示等差数列的前n项和,a表示首项,d表示公差,n表示项数。

a1代表第一项,an代表第n项

例子:

求等差数列1, 3, 5, 7, 9的前5项和。

首项a = 1,公差d = 2,项数n = 5。

代入公式得到:

S5 = (5/2)(2*1 + (5 - 1)*2)
   = (5/2)(2 + 8)
   = (5/2)(10)
   = 25

所以1, 3, 5, 7, 9的前5项和为25。

2.5等比数列计算方法

等比数列是指数列中,任意两个相邻的数的比值都是一个常数。计算等比数列的方法有两种:根据公式计算和逐项计算。

  1. 根据公式计算:
    等比数列的通项公式为:an = a1 * q^(n-1),其中a1是首项,q是公比,n是项数。
    根据此公式,可以直接计算出数列中的任意一项。
  2. 逐项计算:
    根据等比数列的定义,可以逐项计算数列中的每一项。首先确定首项a1和公比q,然后按照以下步骤进行计算:
  • 第1项为a1
  • 第2项为a1 * q
  • 第3项为第2项 * q
  • 以此类推,每一项都是前一项乘以公比q

等比数列的求和公式为:Sn = a1 * (1 - q^n) / (1 - q),其中a1是首项,q是公比,n是项数。

根据这个公式,可以直接计算等比数列的和。

举例说明:

假设有一个等比数列:2, 4, 8, 16, 32,要求求和。

首项a1=2,公比q=2,项数n=5。

根据求和公式,代入对应的值进行计算:

Sn = 2 * (1 - 2^5) / (1 - 2)
   = 2 * (1 - 32) / (-1)
   = 2 * (-31) / (-1)
   = 62

所以,这个等比数列的和为62。

三、空间复杂度

空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。

空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。

空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。

注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。

实例1:

// 计算BubbleSort的空间复杂度?
void BubbleSort(int* a, int n)
{
  assert(a);
  for (size_t end = n; end > 0; --end)
  {
    int exchange = 0;
    for (size_t i = 1; i < end; ++i)
    {
      if (a[i-1] > a[i])
      {
        Swap(&a[i-1], &a[i]);
        exchange = 1;
      }
    }
 
    if (exchange == 0)
      break;
  }
}

实例2:

// 计算Fibonacci的空间复杂度?
// 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
  if(n==0)
     return NULL;
 
  long long * fibArray = (long long *)malloc((n+1) * sizeof(long long));
  fibArray[0] = 0;
  fibArray[1] = 1;
  for (int i = 2; i <= n ; ++i)
  {
    fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
  }
 
  return fibArray;
}

实例3:

// 计算阶乘递归Fac的空间复杂度?
long long Fac(size_t N)
{
  if(N == 0)
     return 1;
 
   return Fac(N-1)*N;
}

实例答案及分析:

  1. 实例1使用了常数个额外空间,所以空间复杂度为 O(1)
  2. 实例2动态开辟了N个空间,空间复杂度为 O(N)
  3. 实例3递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间。空间复杂度为O(N)

四、 常见复杂度对比

一般算法常见的复杂度如下:

五、 复杂度的oj练习

3.1消失的数字OJ链接

3.2 旋转数组OJ链接


相关文章
|
27天前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
44 1
|
1月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
99 4
|
5天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
44 20
|
28天前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
28天前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
27天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
61 1
|
1月前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
215 9
|
1月前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
37 1
|
29天前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
55 5
|
1月前
|
存储 算法 Java
数据结构的栈
栈作为一种简单而高效的数据结构,在计算机科学和软件开发中有着广泛的应用。通过合理地使用栈,可以有效地解决许多与数据存储和操作相关的问题。