【数据结构初阶】一、算法的时间复杂度和空间复杂度

简介: 目录一、什么是数据结构二、什么是算法三、算法效率3.1 如何衡量一个算法的好坏 3.2 算法的复杂度

目录

一、什么是数据结构

二、什么是算法

三、算法效率

3.1 如何衡量一个算法的好坏

3.2 算法的复杂度

四、时间复杂度

4.1 时间复杂度的概念

4.2 大O的渐进表示法

4.3 常见时间复杂度计算举例

五、空间复杂度

六、常见复杂度对比

七、复杂度的oj练习


一、什么是数据结构

       数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合

二、什么是算法

       算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果

数据结构和算法的重要性:在笔试面试中会出现大量关于数据结构和算法题目。对于大部分程序员而言,在工作中不是必须的但是你要找工作,特别是刚毕业参加校招的学生,想进入一些比较大的公司,是必须要学好算法的

-------------------我是分割线------------------  

三、算法效率

3.1 如何衡量一个算法的好坏

如何衡量一个算法的好坏呢?比如对于以下斐波那契数列:

测试代码:

#include<stdio.h>intFib(intn)
{
if (n>2)
returnFib(n-1) +Fib(n-2);
elsereturn1;
}
intmain()
{
inta=Fib(50);
printf("%d\n", a);
return0;
}

使用递归计算,代码虽然比较简洁,但其实是非常捞的,你会发现递归去计算第50个斐波那契数时都要跑半天。

斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?

-------------------我是分割线------------------  

3.2 算法的复杂度

       算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。


 时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。

四、时间复杂度

4.1 时间复杂度的概念

       时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度

即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度

测试例子:请计算一下Func1中++count语句总共执行了多少次?

测试代码:

voidFunc1(intN)
{
intcount=0;
for (inti=0; i<N; ++i)
    {
for (intj=0; j<N; ++j)
        {
++count;
        }
    }
for (intk=0; k<2*N; ++k)
    {
++count;
    }
intM=10;
while (M--)
    {
++count;
    }
printf("%d\n", count);
}
intmain()
{
Func1(10);
return0;
}

Func1 执行的基本操作次数 :F(N) = N * N + 2 * N + 10

  • 如果N = 10 ,F(N) = 130
  • N = 100 ,F(N) = 10210
  • N = 1000 ,F(N) = 1002010

实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法

4.2 大O的渐进表示法

大O符号(Big O notation):是用于描述函数渐进行为的数学符号

推导大O阶方法:

  • (1)用常数1取代运行时间中的所有加法常数。
  • (2)在修改后的运行次数函数中,只保留最高阶项。
  • (3)如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。

使用大O的渐进表示法以后,Func1的时间复杂度为O(N^2)

  • 如果N = 10, F(N) = 100
  • N = 100 ,F(N) = 10000
  • N = 1000 ,F(N) = 1000000

通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。

外有些算法的时间复杂度存在最好、平均和最坏情况:

  • 最坏情况:任意输入规模的最大运行次数(上界)
  • 平均情况:任意输入规模的期望运行次数
  • 最好情况:任意输入规模的最小运行次数(下界)

例如:在一个长度为N数组中搜索一个数据x

  • 最好情况:1次找到
  • 最坏情况:N次找到
  • 平均情况:N/2次找到

在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)

-------------------我是分割线------------------    

4.3 常见时间复杂度计算举例

(1)计算Func2的时间复杂度

voidFunc2(intN)
{
intcount=0;
for (intk=0; k<2*N ; ++k)
    {
++count;
    }
intM=10;
while (M--)
    {
++count;
    }
printf("%d\n", count);
}

分析:

image.png

Func2的时间复杂度函数为F(N) = (2N + 10)

使用大O渐近表示法:保留影响最大的一项、去掉系数则为O(N)

-------------------我是分割线------------------    

(2)计算Func3的时间复杂度

voidFunc3(intN, intM)
{
intcount=0;
for (intk=0; k<M; ++k)
    {
++count;
    }
for (intk=0; k<N ; ++k)
    {
++count;
    }
printf("%d\n", count);
}

分析:

Func3的时间复杂度函数为F(N) = (M + N)

使用大O渐近表示法:不一定只有一个未知数,所以这里可以写O(M + N)

也可以写成如下:O(max(M, N)):取M和N的较大值

O(M):如果能说明M远大于N,比如 M 是一百万,N是100

O(N):如果能说明N远大于M,比如 N是一百万,M是100

O(N)/O(M):M和N差不多大,取哪个都行

  -------------------我是分割线------------------  

(3)计算Func4的时间复杂度

voidFunc4(intN) 
{
intcount=0;
for (intk=0; k<100; ++k)
    {
++count;
    }
printf("%d\n", count);
 }

分析:

Func4的时间复杂度函数为F(N) = (100)

使用大O渐近表示法:使用1代表常数,所以O(1)

 -------------------我是分割线------------------  

(4)计算BubbleSort的时间复杂度

voidBubbleSort(int*a, intn) 
{
assert(a);
for (size_tend=n; end>0; --end)
    {
intexchange=0;
for (size_ti=1; i<end; ++i)
        {
if (a[i-1] >a[i])
            {
Swap(&a[i-1], &a[i]);
exchange=1;
            }
        }
if (exchange==0)
break;
    }
}   

这是冒泡排序的一个优化版本,在一趟排序的过程中如果没有交换数据的话,它就会跳出循环,所以它是有最好、平均、最坏的情况的

BubbleSort的时间复杂度函数为F(N) = (n + (n - 1) + (n - 2) … + 2 + 1)

所以你会发现这是一个等差数列,利用公式整合得:F(N) = (n + 1)* n / 2 -> F(N) = n^2 / 2 + n / 2

使用大O渐近表示法:

  • (最坏情况):O(N^2) -> 这是我们要考虑的情况,显然如果是最坏的情况,那我们就优化了个寂寞
  • (平均情况):O(N^2) -> (n^2 / 2 + n / 2)/2
  • (最好情况):O(N)

-------------------我是分割线------------------  

(5)计算BinarySearch的时间复杂度

intBinarySearch(int*a, intn, intx) 
{
assert(a);
intbegin=0;
intend=n-1;
while (begin<end)
    {
intmid=begin+ ((end-begin)>>1);
if (a[mid] <x)
begin=mid+1;
elseif (a[mid] >x)
end=mid;
elsereturnmid;
    }
return-1;
}

分析:

BinarySearch依然存在最好、平均、最坏的情况:

BinarySearch的时间复杂度函数为F(N) = N / 2 / 2 / 2 … /2 = 1

使用大O渐近表示法:O(log₂N)或O(logN) -> 因为底数不好打出来,有时候一般也这样写

  • 1、N / 2
  • 2、N / 2 / 2 -> N / 4:N / 2^2
  • 3、N / 2 / 2 / 2 -> N / 8:N / 2^3
  • x、N / 2^x = 1 -> N = 2^x -> log₂N = x

注:后面为了方便,以2为底的对数都简写成 logN

-------------------我是分割线------------------    

(6)计算阶乘递归Fac的时间复杂度

longlongFac(size_tN) 
{
if(1==N)
return1;
returnFac(N-1)*N; 
}

分析:

Fac的时间复杂度为F(N) = (N)

使用大O渐近表示法:O(N)

-------------------我是分割线------------------  

(7)计算斐波那契递归Fib的时间复杂度

longlongFib(size_tN) 
{
if(N<3)
return1;
returnFib(N-1) +Fib(N-2);
}

分析:


2^0 + 2^1 + 2^2 + 2^3 … +2^(N-3) + 2^(N-2)

通过计算分析发现基本操作递归了2^N次,时间复杂度为O(2^N)

 -------------------我是分割线------------------  

五、空间复杂度

       空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度


空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法


注意:

       函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定

计算空间复杂度相对简单一些

例子:

(1)计算BubbleSort的空间复杂度

voidBubbleSort(int*a, intn) 
{
assert(a);
for (size_tend=n; end>0; --end)
    {
intexchange=0;
for (size_ti=1; i<end; ++i)
        {
if (a[i-1] >a[i])
            {
Swap(&a[i-1], &a[i]);
exchange=1;
            }
        }
if (exchange==0)
break;
    }
}   

分析:

相比时间复杂度来说:时间是累计的,但空间不是累计的(可以重复利用)

BubbleSort的空间复杂度为F(N) = (3)

使用大O渐近表示法:O(1)

使用了常数个额外空间,所以空间复杂度为 O(1)

-------------------我是分割线------------------

2)算Fibonacci的空间复杂度

// 返回斐波那契数列的前n项longlong*Fibonacci(size_tn)
{
if(n==0)
returnNULL;
longlong*fibArray= (longlong*)malloc((n+1) *sizeof(longlong));
fibArray[0] =0;
fibArray[1] =1;
for (inti=2; i<=n ; ++i)
{
fibArray[i] =fibArray[i-1] +fibArray [i-2];
}
returnfibArray;
}

分析:

动态开辟了N个空间,空间复杂度为 O(N)

------------------我是分割线------------------

(3)计算阶乘递归Fac的空间复杂度

longlongFac(size_tN)
{
if(N==0)
return1;
returnFac(N-1)*N;
}

分析:

递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间。空间复杂度为O(N)

-------------------我是分割线------------------

六、常见复杂度对比

一般算法常见的复杂度如下

image.png

image.png

七、复杂度的oj练习

(1)消失的数字OJ链接:https://leetcode-cn.com/problems/missing-number-lcci/

int missingNumber(int* nums, int numsSize)
{
    int i = 0;
    int sum1 = 0;
    int sum2 = 0;
    for(i = 0; i < numsSize; i++)
    {
        sum1 += nums[i];
    }
    for(i = 0; i <= numsSize; i++)
    {
        sum2 += i;
    }
    return sum2 - sum1;
}

(2)旋转数组OJ链接:https://leetcode-cn.com/problems/rotate-array/

image.png

  1. image.png
voidrotate(int*nums, intnumsSize, intk)
{
k=k%numsSize;
intleft=0;
intright=numsSize-1;
intn=k-1;
while (left<right)
        {
inttmp=nums[left];
nums[left] =nums[right];
nums[right] =tmp;
left++;
right--;
        }
left=0;
while (left<n)
    {
inttmp=nums[left];
nums[left] =nums[n];
nums[n] =tmp;
left++;
n--;
    }
right=numsSize-1;
while (k<right)
    {
inttmp=nums[k];
nums[k] =nums[right];
nums[right] =tmp;
k++;
right--;
    }
}

-------------------我是分割线-----------------

推荐两个刷题网站:

https://leetcode.cn/

https://www.nowcoder.com/

最后,也是最重要的:

算法的学习不只是理论的支持,更需要你不断的在理论的基础上去code,去思考。

文章就到这里

相关文章
|
15天前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
58 4
|
13天前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
2月前
|
搜索推荐 算法
插入排序算法的平均时间复杂度解析
【10月更文挑战第12天】 插入排序是一种简单直观的排序算法,通过不断将未排序元素插入到已排序部分的合适位置来完成排序。其平均时间复杂度为$O(n^2)$,适用于小规模或部分有序的数据。尽管效率不高,但在特定场景下仍具优势。
|
12天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
36 1
|
2月前
|
存储 算法 Java
Set接口及其主要实现类(如HashSet、TreeSet)如何通过特定数据结构和算法确保元素唯一性
Java Set因其“无重复”特性在集合框架中独树一帜。本文解析了Set接口及其主要实现类(如HashSet、TreeSet)如何通过特定数据结构和算法确保元素唯一性,并提供了最佳实践建议,包括选择合适的Set实现类和正确实现自定义对象的hashCode()与equals()方法。
40 4
|
2月前
|
算法
[数据结构] -- 时间复杂度和空间复杂度
[数据结构] -- 时间复杂度和空间复杂度
16 0
|
1月前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
140 9
|
26天前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
24 1
|
13天前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
32 5
|
29天前
|
存储 算法 Java
数据结构的栈
栈作为一种简单而高效的数据结构,在计算机科学和软件开发中有着广泛的应用。通过合理地使用栈,可以有效地解决许多与数据存储和操作相关的问题。