【数据结构】算法的时间和空间复杂度(上)

简介: 【数据结构】算法的时间和空间复杂度(上)

1.什么是算法?


算法:

算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为 输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。

常见应用于排序/二分查找


算法特点:

1.有穷性。一个算法应包含有限的操作步骤,而不能是无限的。事实上“有穷性”往往指“在合理的范围之内”。如果让计算机执行一个历时1000年才结束的算法,这虽然是有穷的,但超过了合理的限度,人们不把他视为有效算法。

2. 确定性。算法中的每一个步骤都应当是确定的,而不应当是含糊的、模棱两可的。算法中的每一个步骤应当不致被解释成不同的含义,而应是十分明确的。也就是说,算法的含义应当是唯一的,而不应当产生“歧义性”。

3. 有零个或多个输入、所谓输入是指在执行算法是需要从外界取得必要的信息。

4. 有一个或多个输出。算法的目的是为了求解,没有输出的算法是没有意义的

5.有效性。 算法中的每一个 步骤都应当能有效的执行。并得到确定的结果。


1.1算法的复杂度

算法在编写成可执行程序后,运行时需要耗费时间资源和空间 ( 内存 ) 资源 。因此 衡量一个算法的好坏,一般是从时间空间两个维度来衡量的 ,即时间复杂度和空间复杂度。

时间复杂度主要衡量一个算法的 运行快慢 ,而空间复杂度主要衡量一个算法运行 所需要的额外空间(需要多少内存) 。在计算 机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。


2.算法的时间复杂度


2.1 时间复杂度的概念

时间复杂度的定义:在计算机科学中, 算法的时间复杂度是一个函数( 数学函数式,不是c语言的那些嵌套函数) ,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的 执行次数 ,为算法 的时间复杂度。


计算Func1中++count语句总共执行了多少次

让我们来实践一下吧:

// 请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
  int count = 0;
  for (int i = 0; i < N; ++i)
  {
    for (int j = 0; j < N; ++j)
    {
      ++count;
    }
  }
  for (int k = 0; k < 2 * N; ++k)
  {
    ++count;
  }
  int M = 10;
  while (M--)
  {
    ++count;
  }
  printf("%d\n", count);
}


时间复杂度的函数式(也就是Func1 执行的基本操作次数):

                                              F(N)=N^2+2N+10

但是这个表达式,太准确,太细节,太繁琐了。时间复杂度不是准确地计算出这个数学函数式的执行次数,而是给它分一个级别,它到底是哪个量级的。

举例:就像马云和马化腾,不需要关心他们的账户具体几分几毛,只需要知道他们是富豪就行了。


准确值F(N)=N^2+2N+10
估算值O(N^2)

N = 10

F(N) = 130 100

N = 100

F(N) = 10210

10000

N = 1000

F(N) = 1002010

1000000


结论1:

N越大,后面项对结果影响越小,也就是说 阶数最高(N^2)的那一项就是影响最大的,保留最高阶项。

结论2:

通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。

实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。

只要用大O这个东西来表示就说明它是一个估算的值。


2.2 O的渐进表示法

O符号(Big O notation):是用于描述函数渐进行为的数学符号。


推导大O阶方法:

1、用常数1取代运行时间中的所有加法常数

2 、在修改后的运行次数函数中, 只保留最高阶项 。

3 、如果最高阶项存在且不是 1 ,则 去除 与这个项目 相乘的常数 。得到的结果就是大 O 阶。


有些算法的时间复杂度存在最好、平均和最坏情况:

最坏情况:任意输入规模的最大运行次数(上界)

平均情况:任意输入规模的期望运行次数

最好情况:任意输入规模的最小运行次数(下界)


例如:在一个长度为N数组中搜索一个数据x:

最好情况:1次找到

最坏情况:N次找到

平均情况:N/2次找到


在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)


2.3常见时间复杂度计算举例

实例1:执行2N+10次

// 计算Func2的时间复杂度?
void Func2(int N)
{
 int count = 0;
 for (int k = 0; k < 2 * N ; ++ k)
 {
 ++count;
 }
 int M = 10;
 while (M--)
 {
 ++count;
 }
 printf("%d\n", count);
}


基本操作执行了2N+10次,通过推导大O阶方法知道,时间复杂度为 O(N)


实例2:执行M+N次

// 计算Func3的时间复杂度?
void Func3(int N, int M)
{
 int count = 0;
 for (int k = 0; k < M; ++ k)
 {
 ++count;
 }
 for (int k = 0; k < N ; ++ k)
 {
 ++count;
 }
 printf("%d\n", count);
}


实例 2 基本操作执行了 M+N 次,有两个未知数 M 和 N ,时间复杂度为 O(N+M)

不能说N无限大了,M就不重要了。除非说会给出一个关系:

N远大于M,则时间复杂度为O(N)

M远大于N,则时间复杂度为O(M)

M等于N或二者相差不大时,则时间复杂度为O(M+N)


实例3:执行了100000000次

void Func4(int N)
{
  int count = 0;
  for (int k = 0; k < 100000000; ++k)
  {
    ++count;
  }
  printf("%d\n", count + N);
}
int main()
{
  Func4(100000);
  Func4(1);
  return 0;
}


执行:实际上cpu的速度是非常快的,相差的执行次数可以忽略,所以时间复杂度依旧为O(1)

O(1)不是代表1次,而是代表常数次,就算k<10亿,它也是O(1)

我们平时能写到的常数最大也就是40多亿左右(整型能表示的范围),cpu是可以承受的。

437f33e619a94c4e899d51c8ac8e0c7d.png

实例3基本操作执行了100000000次,通过推导大O阶方法,时间复杂度为 O(1)


实例4:计算strchr的时间复杂度

// 计算strchr的时间复杂度?
const char * strchr ( const char * str, int character );


这是关于strchr的模拟实现

#include<stdio.h>
#include<assert.h>
char* my_strchr(const char* str, const char ch)
{
  assert(str);
  const char* dest = str;
  while (dest != '\0' && *dest != ch)
  {
    dest++;
  }
  if (*dest == ch)
    return (char*)dest;
  return NULL;
}
int main()
{
  char* ret = my_strchr("hello", 'l');
  if (ret == NULL)
    printf("不存在");
  else
    printf("%s\n", ret);
  return 0;
}

27d510fccb8e4671ab8d5bcefd777169.png

我的理解就是strchr和strstr的区别:就是strstr是输入一个字符串在主串中查找,而strchr是输入一个字符,然后在主串中查找。这个链接有关于strstr的知识点:http://t.csdn.cn/NEaip

若查找失败,返回NULL。查找成功则返回首字符的地址,然后打印的时候一直到'\0'结束

所以说:

指明了这个数组的长度然后去查找它的时间复杂度才是O(1),长度不明确的话,长度就是N,那么需要递归N次,时间复杂度就是O(N)

实例 4 基本操作执行最好 1 次,最坏 N 次,时间复杂度一般看最坏,时间复杂度为 O(N)


实例5:计算BubbleSort的时间复杂度

// 计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
 assert(a);
 for (size_t end = n; end > 0; --end)
 {
 int exchange = 0;
 for (size_t i = 1; i < end; ++i)
 {
 if (a[i-1] > a[i])
 {
 Swap(&a[i-1], &a[i]);
 exchange = 1;
 }
 }
 if (exchange == 0)
 break;
 }
}


图解:

e2db82c7a2924317a918831264fc302e.png

那么比较的次数构成等差数列:用等差数列求和公式得到最后的执行次数是F(N)=(N-1)*N/2;

这题关于循环的不是说有两层循环嵌套就直接判断它的时间复杂度是O(N^2),因为如果比较次数是已知的(外层循环n<10,内层循环n<1000000)那就是O(1) ,而且冒泡排序会有优化版本,在有序的情况下,他的时间复杂度是O(N),只走外层循环。

实例 5 基本操作执行最好 N 次,最坏执行了 (N*(N+1)/2 次,通过推导大 O 阶方法 + 时间复杂度一般看最坏,时间复杂度为 O(N^2)

相关文章
|
20天前
|
机器学习/深度学习 算法 程序员
读《趣学算法》:重开算法之门,时间复杂度与空间复杂度
本文是作者阅读《趣学算法》后的笔记,介绍了算法复杂度的基本概念,包括时间复杂度和空间复杂度的不同阶表示,并通过具体例子展示了如何计算和理解算法的效率。
53 2
读《趣学算法》:重开算法之门,时间复杂度与空间复杂度
|
29天前
|
算法
【初阶数据结构】复杂度算法题篇
该方法基于如下的事实:当我们将数组的元素向右移动 k 次后,尾部 kmodn 个元素会移动至数组头部,其余元素向后移动 kmodn 个位置。
|
30天前
|
机器学习/深度学习 人工智能 算法
【人工智能】线性回归模型:数据结构、算法详解与人工智能应用,附代码实现
线性回归是一种预测性建模技术,它研究的是因变量(目标)和自变量(特征)之间的关系。这种关系可以表示为一个线性方程,其中因变量是自变量的线性组合。
38 2
|
1月前
|
搜索推荐
九大排序算法时间复杂度、空间复杂度、稳定性
九大排序算法的时间复杂度、空间复杂度和稳定性,提供了对各种排序方法效率和特性的比较分析。
50 1
|
2月前
|
存储 算法 索引
算法与数据结构
算法与数据结构
36 8
|
29天前
|
算法
【初阶数据结构篇】二叉树算法题
二叉树是否对称,即左右子树是否对称.
|
29天前
|
算法 索引
【初阶数据结构篇】单链表算法题进阶
深拷贝应该正好由 n 个全新节点组成,其中每个新节点的值都设为其对应的原节点的值。
|
29天前
|
存储 算法
【初阶数据结构篇】顺序表和链表算法题
此题可以先找到中间节点,然后把后半部分逆置,最近前后两部分一一比对,如果节点的值全部相同,则即为回文。
|
2月前
|
算法 搜索推荐 数据处理
震惊!Python算法设计背后,时间复杂度与空间复杂度的惊天秘密大起底!
【7月更文挑战第24天】在编程世界里, Python以简洁强大备受欢迎, 但算法设计与复杂度分析对程序性能至关重要。算法是程序的灵魂, 其效率直接影响数据处理能力。时间复杂度衡量算法执行速度, 如冒泡排序O(n²)与快速排序O(n log n)的显著差异; 空间复杂度关注内存占用, 递归算法需警惕栈溢出风险。优秀算法需平衡时间和空间效率, 深入理解问题本质, 迭代优化实现高效可靠。
31 2
|
1月前
|
存储 缓存 算法
深入解析B树:数据结构、存储结构与算法优势
深入解析B树:数据结构、存储结构与算法优势