数据结构学习笔记——图的遍历算法(深度优先搜索和广度优先搜索)

简介: 数据结构学习笔记——图的遍历算法(深度优先搜索和广度优先搜索)

一、图的遍历概念


图的遍历指从图中某一顶点出发(任意一个顶点都可以作为访问的起始顶点),按照某种遍历方法,对图中所有的顶点访问一次且只访问一次。图与树不一样,其中一个顶点可能与多个顶点相连,所以需记录已访问过的顶点,当访问一个顶点后,考虑如何选取下一个要访问的顶点。


图的遍历分为两种,深度优先搜索和广度优先搜索,这两种方法对无向图和有向图都适用。


二、深度优先搜索(DFS)


(一)DFS算法步骤


前面文章中,讲到过二叉树的先序遍历,其实这里图的深度优先搜索(DFS)是由其推广而来的。


二叉树的先序遍历中,首先是根结点,遍历完根结点的左子树,然后再遍历完根结点的右子树,依次下去至所有结点都遍历到。


图的深度优先搜索首先选取图中某一顶点vi,访问后,任意选取一个与vi邻接的顶点,且该顶点未被访问,……,继续重复该过程,直到图中所有与vi连通的顶点都被访问到;若还有顶点未被访问到,则另外选取一个未被访问的顶点再次作为起始点,重复以上步骤,继续直至图中所有结点被访问。

可以看出DFS算法是一个递归过程,其中需借助一个栈完成操作。


写出下面这个图的深度优先遍历序列:

1667295617310.jpg


其深度优先遍历序列为:0,4,6,9,8,7,5,3,2,1。


1、邻接表DFS算法步骤


例如下面这个无向图:

1667295641716.jpg


该图的邻接表如下:

1667295652898.jpg

通过邻接表进行深度优先搜索的步骤如下(以V1为访问起始点,不唯一):

1、首先访问0,即V1,访问后标记已访问过;

2、查看V1单链表,第一个未访问的邻接顶点为2,即V3,并以V3为出发点继续深度遍历;

3、查看V3单链表,其第一个未访问的邻接顶点为6,即V7,再以V7为出发点继续深度遍历;

4、查看V7单链表,其邻接顶点为2,即V3,它已经被访问过,于是回到V3单链表,搜索下一个未被访问的邻接顶点;

5、查看V3单链表,其下一个未访问的邻接顶点为5,即V6,以V6为出发点继续深度遍历;

6、查看V6单链表,其邻接顶点为2,也是已经被访问过,于是回到V3单链表,搜索下一个未被访问的邻接顶点;

7、查看V3单链表,其邻接顶点为0,即V1,一开始被访问过,于是回到V1单链表,搜索下一个未被访问的邻接顶点;

8、查看V1单链表,其下一个未访问的邻接顶点为1,即V2,并以V2为出发点继续深度遍历;

9、查看V2单链表,其第一个未访问的邻接顶点为4,即V5,再以V5为出发点继续深度遍历;

10、查看V5单链表,其第一个未访问的邻接顶点为7,即V8,再以V8为出发点继续深度遍历;

11、查看V8单链表,其邻接顶点为4,即V5,已经被访问过,于是回到V5单链表,搜索下一个未被访问的邻接顶点;

12、查看V5单链表,其下一个未被访问的邻接顶点为1,即V2,于是回到V2单链表,搜索下一个未被访问的邻接顶点;

13、查看V2单链表,其邻接顶点为3,即V4,并以V4为出发点继续深度遍历;;

14、查看V4单链表,其邻接顶点为7,即V8,再以V8为出发点继续深度遍历;

15、查看V8单链表,其邻接顶点为3,即V4,再以V4为出发点继续深度遍历;

16、查看V4单链表,其邻接顶点为1,即V2,再以V2为出发点继续深度遍历;

17、查看V2单链表,其邻接顶点为0,即V1,再以V1为出发点继续深度遍历;

18、查看V1单链表,其邻接顶点为2,即V3,V3中已经不存在未访问的顶点,于是回到V1单链表。

19、查看V1单链表,下一个邻接顶点为1,即V2,V2中已经不存在未访问的顶点,最后回到V1单链表,遍历完成。

故该图的深度优先遍历序列为:V1、V3、V7、V6、V2、V5、V8、V4。


2、邻接矩阵DFS算法步骤


通过图的邻接矩阵实现深度优先搜索,例如下面这个图(以V1为访问起始点,是唯一的):


例如,对于下面这个有向图,对其进行深度优先搜索:

1667295683422.jpg


其邻接矩阵如下:

1667295695278.jpg

1、由V1开始,如下表【第一行为回退点,第二行为深度优先搜索得到的序列】:


V1



2、通过其邻接矩阵知,访问第一行第二列的1对应的V2顶点,由于它是在V1的行中被访问到的,所以回退点为V1:


V1
V1 V2



3、由于访问了V2,即开始访问V2行,访问第二行第三列的1对应的V4顶点,由于它是在V2的行中被访问到的,所以回退点为V2:


V1 V2
V1 V2 V4


4、由于访问了V4,即开始访问V4行,访问第四行第五列的1对应的V5顶点,由于它是在V4的行中被访问到的,所以回退点为V4:


V1
V2 V4
V1 V2 V4 V5


5、由于访问了V5,即开始访问V5行,由于第五行都为0,回退到V4,由于V4行顶点都访问完,回退到V2,由于V2行顶点都访问完,回退到V1行,此时V1行还剩第一行第三列的1对应的V3顶点未访问,访问该顶点:


V1
V2 V4
V1 V2 V4 V5 V3


6、至此,访问完了图中的所有顶点,即深度优先搜索序列为V1、V2、V4、V5、V3。


✨对于深度优先搜索(DFS),由于基于邻接表的遍历得到的序列可能不是唯一的,即根据边的输入次序不同,从而得到的邻接表不同,从而遍历序列不一样;而基于邻接矩阵所得到的DFS遍历序列是唯一的。


(二)深度优先生成树、森林


对一个连通图或非连通图进行DFS遍历后,若将在遍历过程中所经历过的顶点保留,则可以形成一棵树或森林,即深度优先生成树或深度优先生成森林;另外,基于邻接表存储的深度优先生成树或深度优先生成森林也是不唯一的;而对于邻接矩阵则是唯一的。

例如,上面这个无向连通图遍历DFS遍历生成的深度优先生成树如下(基于邻接表):

1667295759023.jpg

例如,对于上面这个有向图进行DFS遍历:

1667295768392.jpg

它并不是连通图,得到的深度优先生成森林如下:

1667295777069.jpg


(三)DFS的空间复杂度和时间复杂度


对于一个图G=(V,E),由顶点集V和边集E组成。

1、DFS算法的空间复杂度


✨由于DFS算法是一个递归算法,即递归顶点集V,通过DFS遍历的空间复杂度为O(|V|)。

2、DFS算法的时间复杂度


✨时间复杂度取决于图的存储结构,若通过邻接矩阵表示图,则查找顶点的邻接顶点所需时间为O(|V|),总时间复杂度为O(|V2|)(邻接矩阵为方阵n×n);若通过邻接表表示图,则查找所有顶点的邻接顶点所需时间为O(|E|),访问顶点所需时间为O(|V|),即总时间复杂度为O(|V|+|E|)。


三、广度优先搜索(BFS)


(一)BFS算法步骤


前面文章中,讲到过二叉树的层序遍历,其实这里图的广度优先搜索(BFS)是由其推广而来的。


二叉树的层序遍历中,层次优先,当对一层的结点都遍历完后,遍历下一层,按照次序对每个结点的左、右孩子进行遍历。


图的广度优先搜索中需要借助到队列来遍历,首先选取一个起始点顶点vi,访问后将其入队并标记为已访问(使用队列用于避免重复访问,存放已经访问过的各邻接顶点);当队列不为空时检查出队顶点的所有邻接顶点,访问未被访问的邻接顶点并将其入队,……,继续重复该过程,直到图中所有与vi连通的顶点都被访问到;当队列为空时跳出循环,则此时遍历完成。

可以知道BFS算法并不是递归过程,且要用到队列。


1、邻接表BFS算法步骤

例如下面这个无向图:

1667295828963.jpg

该图的邻接表如下:

1667295840759.jpg

通过邻接表进行广度优先搜索的步骤如下(这里以V1为访问起始点,不唯一):

1、首先访问0,即V1,访问后标记已访问过,使其入队,然后删除当前队头结点;【V1】

2、遍历V1单链表,使其未访问的邻接顶点2、1入队并标记;【V2、V3】

3、访问队头结点1并删除,然后遍历1对应的V2单链表,使其未访问的邻接顶点4、3入队并标记;【V3、V4、V5】

4、访问队头结点2并删除,然后遍历2对应的V3单链表,使其未访问的邻接顶点6、5入队并标记;【V4、V5、V6、V7】

5、访问队头结点3并删除,然后遍历3对应的V4单链表,使其未访问的邻接顶点7入队并标记;【V5、V6、V7、V8】

6、访问队头结点4并删除,然后遍历4对应的V5单链表,该单链表中无未访问的顶点;【V6、V7、V8】

7、访问队头结点5并删除,然后遍历5对应的V6单链表,该单链表中无未访问的顶点;【V7、V8】

8、访问队头结点6并删除,然后遍历6对应的V7单链表,该单链表中无未访问的顶点;【V8】

9、访问队头结点7并删除,然后遍历7对应的V8单链表,该单链表中无未访问的顶点,此时队列为空,遍历结束;【】

故该图的深度优先遍历序列为:V1、V2、V3、V4、V5、V6、V7、V8。


2、邻接矩阵BFS算法步骤

通过图的邻接矩阵实现广度优先搜索,例如下面这个图(以V1为访问起始点,是唯一的):


例如,对于下面这个有向图,对其进行广度优先搜索:

1667295850643.jpg


其邻接矩阵如下:

1667295865296.jpg

1、由V1行开始,如下表:

V1



2、可得与其匹配的有V2、V3,填到表中V1之后:

V1 V2 V3



3、由V2行开始,其中V4未访问,填到V3之后:

V1 V2 V3 V4


4、由V3行开始,都为0,继续下一行。

5、由V4行开始,其中V5未访问,填到V4之后:

V1 V2 V3 V4 V5


6、至此,该图的所有顶点都已访问到,得到的序列便是广度优先搜索,即深度优先搜索序列为V1、V2、V3、V4、V5。


✨同样,对于广度优先搜索,由于基于邻接表的遍历得到的序列可能不是唯一的,即根据边的输入次序不同,从而得到的邻接表不同,从而遍历序列不一样;而基于邻接矩阵所得到的遍历序列是唯一的,这两点和深度优先搜索遍历是一样的。


(二)广度优先生成树、森林


与DFS遍历一样, 对一个连通图或非连通图进行BFS遍历后,若将在遍历过程中所经历过的顶点保留,则可以形成一棵树或森林,即广度优先生成树或广度优先生成森林;另外,基于邻接表存储的广度优先生成树或广度优先生成森林也是不唯一的;而对于邻接矩阵则是唯一的。

例如,上面这个无向连通图遍历BFS遍历生成的深度优先生成树如下(基于邻接表):

1667295922869.jpg

例如,对于上面这个有向图进行BFS遍历:

1667295931980.jpg

它并不是连通图,得到的广度优先生成森林如下:

1667295940343.jpg


例如写出下面这个图的广度优先遍历序列:

1667295948004.jpg


其广度优先遍历序列为:0,4,3,2,1,6,5,9,8,7。


(三)BFS的空间复杂度和时间复杂度


对于一个图G=(V,E),由顶点集V和边集E组成。

1、BFS算法的空间复杂度


✨通过BFS遍历的空间复杂度为O(|V|)。

2、BFS算法的时间复杂度


✨时间复杂度取决于图的存储结构,若通过邻接矩阵表示图,则查找顶点的邻接顶点所需时间为O(|V|),总时间复杂度为O(|V2|)(邻接矩阵为方阵n×n),这和DFS算法的时间复杂度是一样的;若通过邻接表表示图,则每个顶点都入队一次,即所需时间为O(|V|),搜索顶点的邻接顶点所需时间为O(|E|),其时间复杂度为O(|V|+|E|)。


四、DFS和BFS的应用


以上两种遍历算法都可以用于判断图的连通性,可计算图中的连通分量数目,当一个图为连通图时,经过遍历后会访问到所有的顶点,其中访问过的顶点不会再次访问,从而可以得到图中的连通分量数目。


相关文章
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
117 4
|
3月前
|
存储 人工智能 算法
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
这篇文章详细介绍了Dijkstra和Floyd算法,这两种算法分别用于解决单源和多源最短路径问题,并且提供了Java语言的实现代码。
99 3
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
|
11天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
49 20
|
2月前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
2月前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
112 23
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
65 1
|
3月前
|
机器学习/深度学习 存储 缓存
数据结构与算法学习十:排序算法介绍、时间频度、时间复杂度、常用时间复杂度介绍
文章主要介绍了排序算法的分类、时间复杂度的概念和计算方法,以及常见的时间复杂度级别,并简单提及了空间复杂度。
50 1
数据结构与算法学习十:排序算法介绍、时间频度、时间复杂度、常用时间复杂度介绍
|
2月前
|
算法 vr&ar 计算机视觉
数据结构之洪水填充算法(DFS)
洪水填充算法是一种基于深度优先搜索(DFS)的图像处理技术,主要用于区域填充和图像分割。通过递归或栈的方式探索图像中的连通区域并进行颜色替换。本文介绍了算法的基本原理、数据结构设计(如链表和栈)、核心代码实现及应用实例,展示了算法在图像编辑等领域的高效性和灵活性。同时,文中也讨论了算法的优缺点,如实现简单但可能存在堆栈溢出的风险等。
59 0
|
3月前
|
存储 算法 Java
Set接口及其主要实现类(如HashSet、TreeSet)如何通过特定数据结构和算法确保元素唯一性
Java Set因其“无重复”特性在集合框架中独树一帜。本文解析了Set接口及其主要实现类(如HashSet、TreeSet)如何通过特定数据结构和算法确保元素唯一性,并提供了最佳实践建议,包括选择合适的Set实现类和正确实现自定义对象的hashCode()与equals()方法。
55 4
|
3月前
|
搜索推荐 算法
数据结构与算法学习十四:常用排序算法总结和对比
关于常用排序算法的总结和对比,包括稳定性、内排序、外排序、时间复杂度和空间复杂度等术语的解释。
39 0
数据结构与算法学习十四:常用排序算法总结和对比