本章重点
- 什么是数据结构?
- 什么是算法?
- 算法效率
- 时间复杂度
- 空间复杂度
- 常见复杂度对比
- 复杂度oj练习
1. 什么是数据结构?
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。
2.什么是算法?
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。比如:查找、排序等等。
3.算法效率
3.1 如何衡量一个算法的好坏
我们能不能用一个程序运行的开始的时间到程序结束的时间去描述复杂度呢?
答案是不能,一个程序的运行还会受到很多因素的影响,比如电脑的配置、性能。就比如下面两台电脑,让两台电脑同时执行下面递归计算斐波那契数列40是多少的程序。很明显高性能的计算机器多核CPU,进程并发执行,速度高于左边的单核机器。
#include<stdio.h> long long Fib(int N) { if (N < 3) return 1; return Fib(N - 1) + Fib(N - 2); } int main() { //使用斐波那契数列递归方法计算40 long long result = Fib(40); printf("%lld", result); return 0; }
斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。
在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
4.时间复杂度
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。
一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。
一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
Func1 执行的基本操作次数 :
我们发现当N的值越来越多的时候,2*N + 10这个表达式对结果造成的影响非常小,所有实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。
大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
- 用常数1取代运行时间中的所有加法常数。
- 在修改后的运行次数函数中,只保留最高阶项。
- 如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
使用大O的渐进表示法以后,Func1的时间复杂度为:
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。另外有些算法的时间复杂度存在最好、平均和最坏情况:
- 最坏情况:任意输入规模的最大运行次数(上界)
- 平均情况:任意输入规模的期望运行次数
- 最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
- 最好情况:1次找到
- 平均情况:N/2次找到
- 最坏情况:N次找到
在实际中一般情况关注的是算法的最坏运行情况,原因是为了保证算法在任何输入情况下都能保持一定的性能水平。最坏情况时间复杂度是对算法性能的一个保证,确保在任何可能的输入下,算法都不会执行得更差。所以数组中搜索数据时间复杂度为.
常见时间复杂度计算举例
实例一:
// 计算Func2的时间复杂度? void Func2(int N) { int count = 0; for (int k = 0; k < 2 * N; ++k) { ++count; } int M = 10; while (M--) { ++count; } printf("%d\n", count); }
- 第一个循环:for (int k = 0; k < 2 * N; ++k)
这个循环执行了 2 * N 次,其中 N 是输入的参数。
循环内部只有一个基本操作 ++count。
- 第二个循环:while (M--)
这个循环执行了固定的 10 次。
循环内部只有一个基本操作 ++count。
因此,总的基本操作数可以表示为:2 * N + 10。
在大O符号表示法中,我们通常关注最高阶的项,而忽略低阶项和常数系数。在这种情况下,最高阶项是 2 * N。
因此,Func2 函数的时间复杂度可以表示为 O(N)。
实例二:
//计算Func3的时间复杂度? void Func3(int N, int M) { int count = 0; for (int k = 0; k < M; ++k) { ++count; } for (int k = 0; k < N; ++k) { ++count; } printf("%d\n", count); }
- 第一个循环:for (int k = 0; k < M; ++k)
这个循环执行了 M 次,其中 M 是第二个输入参数。
循环内部只有一个基本操作 ++count。
- 第二个循环:for (int k = 0; k < N; ++k)
这个循环执行了 N 次,其中 N 是第一个输入参数。
循环内部只有一个基本操作 ++count。
因此,总的基本操作数可以表示为:M + N。
在大O符号表示法中,我们通常关注最高阶的项,而忽略低阶项和常数系数。在这种情况下,最高阶项是 M 和 N,同时取两者。
因此,Func3 函数的时间复杂度可以表示为 O(M + N)。
补充:
- 若 M 和 N 的值相同,时间复杂度可以表示为 O(M) 或者 O(N)。
- 若 M >> N 的值,时间复杂度可以表示为 O(M)。
- 若 M << N 的值,时间复杂度可以表示为 O(N)。
在这种情况下,最高阶项是 M 或 N,取两者中较大的一个因此,Func3 函数的时间复杂度可以表示为 O(max(M, N))。
【解密算法:时间与空间的博弈】(中):https://developer.aliyun.com/article/1424859