第一章:介绍数据结构与算法
1.1 数据结构的概念
数据结构是指计算机中组织和存储数据的一种方式,用于在计算机程序中高效地检索和操作数据。数据结构是数据的抽象,是通过定义数据元素之间的关系和操作规则来描述数据之间的联系和操作。例如,数组、链表、队列、栈、树、图
等都是数据结构的实现方式。
数据结构可以分为线性结构和非线性结构
。线性结构包括数组、链表、队列、栈
等,这些数据结构中的元素都是呈一条直线状排列的。非线性结构包括树和图
等,这些结构中的元素呈现出一种树形或网络的结构。
数据结构不仅仅是存储数据的方式,还包括对数据操作的一系列方法,例如插入、删除、查找、排序等等。通过有序、高效的数据结构,可以提高程序的性能和效率。
在计算机科学中,数据结构是计算机程序设计的基础,因此学习数据结构对于编写高效、优秀的程序非常重要。
1.2 算法的概念
算法是指解决问题的方法、步骤和策略,它是计算机程序的核心和灵魂。可以将算法看作是一种逻辑的、规范的、有限的、确定的和可行的操作序列。根据特定的问题和场景,通过算法可以得出正确结果或使得所求结果更接近真实结果。
算法可以用来解决各种问题,例如排序、查找、加密、最优化、图像处理、机器学习等等。算法的本质就是对问题的分析和抽象,然后采用合适的方法和步骤解决问题。
编写优秀的算法需要考虑效率、正确性、可读性和易维护性等多方面因素。在实际工作中,算法不仅需要解决问题,还需要具备跨平台、高性能、可扩展、安全等特性和要求。
算法研究一直是计算机科学中的一个重要分支。理论研究的目标是发现性质、理论上的限制和困难、各种问题的复杂性等等。同时,实际应用中的算法也在不断发展和进化。
1.3 数据结构与算法的关系
数据结构和算法是计算机科学中的两个重要学科,其关系非常密切。简单来说,数据结构是算法的基础,而算法是操作数据结构的方法。
下面分别解释其关系:
- 数据结构是算法的基础:数据结构提供了一种组织和存储数据的方法,为算法的设计和实现提供了基础。在进行算法的设计时,需要考虑数据的特点和组织方式,选择合适的数据结构来提高算法的效率和性能。
- 算法是操作数据结构的方法:算法为数据结构提供了实现的方法,通过算法来解决具体问题。算法基于数据结构的基础上进行设计和实现,利用数据结构来存储和操作数据,从而解决具体的问题。
- 数据结构和算法相互影响:数据结构和算法是相互影响的。不同的数据结构对应着不同的算法,不同的算法也需要不同的数据结构来实现。同时,算法的效率和实现的复杂度也会影响数据结构的选择和应用。
因此,数据结构和算法是计算机科学中重要的两个学科,它们相互依存,共同构成了计算机程序的基础。掌握和应用好数据结构与算法,可以提高程序的效率和性能,从而为计算机科学学习和应用创新打下扎实的基础。
1.4 为什么需要学习数据结构与算法
学习数据结构和算法是计算机科学领域的必经之路,以下是一些学习数据结构和算法的必要性:
- 提高程序效率和性能:学习数据结构与算法可以提高程序的效率和性能,使程序
更快、更可靠、更健壮
。通过选择合适的数据结构和算法,可以减少时间和空间复杂度。 - 解决复杂问题:学习数据结构与算法可以帮助我们更好地
理解和解决各种复杂问题
。例如在图形图像处理、人工智能、语音识别等领域都需要用到数据结构与算法知识。 - 提高编程能力: 学习数据结构与算法可以培养
抽象思维和编程能力
,增强对编程语言和程序设计的理解和掌握,可以写出经过科学优化的高质量代码。 - 了解计算机科学的本质:学习数据结构与算法可以让我们
更加深入地了解计算机科学的本质
,从内在的角度看待计算机科学中的问题,在实践中灵活运用。 - 传承计算机科学精神: 数据结构与算法是计算机科学产生的传统精神,学习数据结构与算法是对这种思想和精神的一种传承,可以让我们走进计算机世界中
了解它真正的内在运作机制
。
总之,学习数据结构与算法是提高计算机科学素养和编程能力的关键,是掌握计算机编程的基础。无论是从事计算机科学还是其他科学和工程领域,都需要掌握这门学科。
第二章:时间与空间复杂度
2.1 什么是时间复杂度
时间复杂度是指算法执行所需要的时间,通常用“大O记法”表示。 它是衡量算法渐进时间复杂度的一种方式。算法的时间复杂度主要关注的是算法的基本操作执行次数与数据规模之间的增长速度关系,而非具体的执行时间。通常来讲,时间复杂度越低,算法执行的速度越快
。
2.2 时间复杂度的算法分析
算法的时间复杂度可以通过以下步骤进行分析:
- 定义基本操作:每个算法都有一些基本操作,例如赋值,算术运算,比较,循环和条件分支等。
- 计算基本操作次数:对于算法的每个基本操作,估算它在最坏情况下的执行次数,并将所有基本操作的执行次数相加,得到算法的总基本操作次数。
- 得出算法的复杂度:根据总基本操作次数与数据规模之间的函数关系,用大O记法表示算法的时间复杂度。
例如,对于一个简单的排序算法,如果它需要进行比较的次数为n²,交换的次数也为n²,那么基本操作的执行次数为2n²。因此,该算法的时间复杂度为O(n²)。
需要注意的是,时间复杂度只是算法效率的一种衡量标准,而非实际的执行时间,具体的执行时间还受到很多因素的影响,如硬件性能,数据规模,输入数据的特性等。因此,在实际应用中,需要综合考虑算法的时间复杂度和其他因素来选择合适的算法。
2.3 什么是空间复杂度
空间复杂度是指算法执行过程中需要占用的内存空间,通常用“大O记法”表示。它是衡量算法渐进空间占用的一种方式。算法的空间复杂度主要关注的是算法所需要的额外空间与输入数据规模之间的增长速度关系,而非具体的占用空间。通常来讲,空间复杂度越低,算法所需要的内存空间越少。
2.4 空间复杂度的算法分析
算法的空间复杂度可以通过以下步骤进行分析:
- 定义额外空间:除了原始输入数据的空间以外,算法还需要占用额外的空间,例如栈空间,堆空间,临时变量等。
- 计算额外空间使用量:估算算法在最坏情况下所需要的额外空间数量,并用常量表示,以便于对空间占用与数据规模之间的关系进行比较。
- 得出算法的空间复杂度:根据算法在最坏情况下所需要的额外空间占用与数据规模之间的关系,用大O记法表示算法的空间复杂度。
需要注意的是,空间复杂度的分析与具体的实现方式有关,不同的实现方式可能会占用不同的空间。因此,在分析算法的空间复杂度时,需要关注算法的实现方式,以及所占用的空间是否可以释放。同时,在选用算法时,除了考虑其时间复杂度,也应该综合考虑其所占用的空间复杂度,以选择最优的算法。
2.5 如何评估算法复杂度
评估算法复杂度一般关注算法的时间复杂度和空间复杂度。
- 时间复杂度:评估算法时间复杂度的方法一般采用大O记法,即找到算法执行的最坏情况下基本操作次数与输入规模之间的关系。常见的时间复杂度有O(1), O(logn), O(n), O(nlogn), O(n²), O(2ⁿ)等。一般来说,时间复杂度越小,算法越高效。
- 空间复杂度:评估算法空间复杂度的方法一般也采用大O记法,即找到算法执行的最坏情况下所需要的额外空间与输入规模之间的关系。常见的空间复杂度有O(1), O(n), O(n²)等。一般来说,空间复杂度越小,算法所需要的额外空间越少,效率越高。
需要注意的是,在实际应用时,评估算法的复杂度还需要考虑其他因素,如算法的实现难度,实现复杂度,可维护性等方面的综合评价,以选出最优算法。同时,在某些情况下,可能需要进行时间复杂度与空间复杂度之间的权衡,以选择更加适合应用的算法。
第三章:数组与链表
3.1 数组的定义与特点
数组是一种常见的数据结构,由相同类型的元素(或者称为数组元素、数组项)组成的有限序列。
数组的特点如下:
- 由相同类型的元素组成:数组中所有元素的类型必须相同,可以是基本类型或自定义类型。
- 有限序列:数组的元素个数是有限的,由数组的定义时确定。
- 连续的存储空间:数组中所有元素都是按照索引顺序依次存储在一段连续的存储空间中,可以通过下标(索引)来访问数组中的元素。
- 随机访问:由于数组中所有元素都是按照索引顺序存储,因此可以随机访问数组中的任意一个元素,访问时间为O(1)。
- 数组长度固定:数组一旦定义,其长度就固定了,无法动态调整,如果需要动态增加元素,通常需要创建一个新的数组,并将原有数组的元素复制到新的数组中。
- 数组的大小通常受到内存大小的限制:当数组中元素的个数超过内存大小时,需要考虑如何将数组拆分成更小的块来处理,或者采用其他数据结构来代替数组。
在实际应用中,数组广泛用于存储一维的或多维的数据,如矩阵、图像
等。由于数组具有随机访问的特性,因此在需要频繁查找、插入和删除元素的场景中,如果数据规模不是太大,数组通常是较为高效的数据结构。
3.2 链表的定义与特点
链表也是一种常见的数据结构,与数组不同,链表中的元素是不需要顺序存储在一起的。
链表的特点如下:
- 由一系列节点组成:链表中的每个元素都被封装成一个节点,节点由两部分组成:数据域和指针域,数据域用于存放具体的元素,指针域用于指向下一个节点的地址。
- 非连续的存储空间:链表中的节点可以存储在内存的
任意位置
,因此链表中的元素是非连续的存储。 - 动态存储空间:链表的长度是可以动态变化的,也就是说链表可以根据需要动态添加或删除节点。
- 按顺序访问:链表只能顺序访问,通过指针域找到下一个节点,一次只能访问一个元素,因此链表的访问时间为O(n)。
- 插入和删除时间复杂度为O(1):由于链表的每个节点都包含指向下一个节点的指针,因此在链表中插入和删除元素的时间复杂度只与要插入或删除的位置有关,与链表的长度无关。
- 需要额外的指针开销:为了实现链表,需要为每个节点都开辟一个
指针域
,指向下一个节点的地址,因此链表需要额外的指针开销。
在实际应用中,链表通常用于需要频繁添加或删除元素的场景中,如链式存储文件、图论算法等。由于链表不需要固定的存储空间,因此它比数组更加灵活,可以动态调整它的长度,但是由于访问时间复杂度较高,在需要频繁访问数据的场景中,链表可能不如数组高效。
3.3 数组和链表的比较
数组和链表都是数据结构,它们各自有自己的特点和适用场景。
比较两者可以从以下几个方面进行:
- 存储方式:数组使用连续的内存空间来存储元素,而链表则使用非连续的内存空间,通过节点之间的指针来连接起来。
- 插入和删除操作:数组在中间插入或删除元素时,需要将后续的元素向后或前移,时间复杂度为O(n);而链表在中间插入或删除元素时,只需要更新前后节点的链接关系,时间复杂度为O(1)。
- 随机访问:数组在随机访问元素时时间复杂度为O(1),链表的时间复杂度为O(n)。
- 内存开销:数组需要预先分配一段连续的内存空间,一旦定义了大小就无法调整;而链表可以动态分配内存空间,大小可以动态增长,但是需要额外的指针开销。
- 迭代访问:链表在支持快速插入和删除的同时,往往需要使用迭代(遍历)的方式来访问元素,而数组支持直接通过下标来访问元素。
因此,在选择数组或链表时,需要考虑不同的场景和需求。如果需要频繁访问元素,使用数组会更加高效;如果需要频繁插入或删除元素,使用链表会更加高效;如果数据规模较小,使用数组可能比使用链表更加省内存开销。
3.4 数组和链表的时间复杂度
数组和链表在不同的操作中,其时间复杂度有较大的差别。
- 随机访问(按索引查找元素):数组的时间复杂度为O(1),因为数组元素在内存中是连续存储的,可以通过计算偏移量来快速定位元素;而链表需要遍历链表中的节点,时间复杂度为O(n)。
- 插入和删除操作:对于数组,单次插入或删除操作需要将后续的元素移动位置,时间复杂度为O(n)。对于链表,单次插入或删除操作只需要改变前后节点之间的指针,时间复杂度为O(1)。
- 迭代访问:链表的迭代访问需要遍历整个链表来获取元素,时间复杂度为O(n)。数组可以通过下标直接访问元素,时间复杂度为O(1)。
因此,在不同场景下,应该根据具体需求选择不同的数据结构,以便获得更高效的算法。
3.5 数组和链表的应用场景
数组和链表都是常见的数据结构,它们都有各自适用的场景。下面是数组与链表的一些应用场景:
数组的应用场景:
- 快速访问元素:由于数组在内存中是连续存储的,可以通过索引快速访问元素。因此,当需要频繁访问元素时,数组通常比链表更加高效。
- 存储元素固定,无需频繁插入或删除操作:数组的长度是固定不变的,一旦定义了大小就无法随意调整。如果需要动态调整元素,需要扩展数组大小,这可能会导致数据的频繁拷贝和移动,因此不适用于需要频繁插入或删除元素的场景。
- 矩阵和二维数组存储:矩阵和二维数组的数据元素通常按行或列排列,可以使用二维数组来存储,以方便快速访问。
链表的应用场景:
- 需要频繁插入或删除元素:链表的插入和删除操作时间复杂度都是O(1),不受链表长度影响,因此当需要频繁对元素进行插入和删除时,链表通常比数组更加高效。
- 数据大小经常变化,需要动态调整:链表的长度可以动态变化,每个节点只需要保存它的数据以及指向下一个节点的指针即可,非常灵活。
- 树和图的存储:树和图都可以使用链表来存储,以方便实现快速遍历和查找。
需要注意的是,数组和链表虽然都是常见的数据结构,但在实际应用中,应该根据具体的场景和需求选择合适的数据结构,以获得更优的算法。
第四章:栈与队列
4.1 栈的定义与特点
栈是一种数据结构,它具有以下两个主要特点:
- 后进先出
(LIFO,Last In First Out)
:栈中最后插入的元素将首先被移除。 - 只能从栈顶进行插入和删除操作。
可以想象成是一摞盘子,每放一个盘子都放在最顶端,取盘子也只能从最顶端取,这就是栈的特点。
在栈中,执行插入元素(入栈)和删除元素(出栈)的时间复杂度是O(1),因为所有的操作都只涉及到栈顶元素。栈的应用非常广泛,如表达式求值、逆波兰表示法、深度优先搜索等。
4.2 栈的实现方式
栈的实现方式有两种:数组实现和链表实现。
- 数组实现栈
数组实现栈需要一个固定长度的数组,同时需要一个指针(top)来标识当前栈顶的位置。当需要压入元素时,将元素插入到top指针所指向的位置,并将top指针加1;当需要弹出元素时,将top指针减1并返回top指针所指向的元素即可。需要注意的是,在压入元素时需要判断栈是否已满,弹出元素时也需要判断栈是否为空。
- 链表实现栈
链表实现栈需要一个单向链表,每个节点中除了存储数据之外,还需要一个指针(next)指向下一个节点。当需要压入元素时,将元素插入到链表的头部,即成为新的头节点;当需要弹出元素时,直接删除当前头节点,并将头指针指向下一个节点即可。需要注意的是,在弹出元素时需要判断链表是否为空。
无论是数组实现栈还是链表实现栈,在增删操作时需要保证栈的特性:后进先出。因此,插入和删除操作都需要在栈顶进行。
4.3 栈的应用场景
栈具有后进先出(LIFO)的特点,使得它在一些场景下具有非常好的应用效果.
下面是一些栈的常见应用场景:
- 表达式求值:在编译器、计算器等需要对表达式进行求值的场景下,栈可以帮助我们处理运算符的优先级。
- 括号匹配:在编译器、文本编辑器等需要对代码进行校验的场景下,栈可以用来判断括号是否匹配。
- 浏览器访问历史记录:在浏览器访问网页时,每打开一个新页面就会入栈,可以使用栈来实现返回上一页的功能。
- 函数调用:在程序执行时,每执行一个函数就可以将其入栈,函数执行结束后再出栈。
- 汉诺塔:经典的汉诺塔问题需要使用栈来实现。
总之,栈在递归、回溯、深度优先搜索等算法和数据结构处理中有着至关重要的作用,是相当基础和经典的数据结构之一。
4.4 队列的定义与特点
队列是一种有序的线性数据结构,具有以下两个特点:
- 先进先出 (FIFO,First In First Out):队列的最先加入的元素将首先被删除,而最后加入的元素则后被删除。
- 只能在队尾插入元素,在队头删除元素。
可以想象成排队买东西,需要最先进队列的人先离开队列,而后进队列的人则靠后离开队列,这就是队列的特点。
在队列中,插入元素和删除元素的时间复杂度均为O(1),因此队列常用于需要先进先出的场景,如消费者和生产者问题、消息队列等。
4.5 队列的实现方式
队列的实现方式有两种:数组实现和链表实现。
- 数组实现队列
数组实现队列需要一个固定长度的数组,同时需要两个指针(front和rear),分别标识队列的头部和尾部。当需要插入元素时,将元素插入到rear指针所指向的位置,并将rear指针加1;当需要删除元素时,将front指针指向下一个元素即可。需要注意的是,在插入元素时需要判断队列是否已满,删除元素时也要判断队列是否为空。
- 链表实现队列
链表实现队列需要一个单向链表,每个节点中除了存储数据之外,还需要一个指针(next)指向下一个节点。当需要插入元素时,将元素插入到链表的尾部;当需要删除元素时,删除链表的头部即可。需要注意的是,在删除元素时需要判断队列是否为空。
无论是数组实现队列还是链表实现队列,在增删操作时需要保证队列的特性:先进先出。因此,插入操作只能在队尾进行,删除操作只能在队头进行。
4.6 队列的应用场景
队列是一种常用的数据结构,它具有先进先出(FIFO)的特点,被广泛应用于各种场景中,下面是一些典型的应用场景:
- 线程池任务调度:在线程池中,任务可以存储在队列中,线程从队列中获取任务进行处理。
- 消息队列:在消息队列系统中,消息可以存储在队列中,其他进程或者线程从队列中获取消息进行消费。
- 计算最近K次平均值:在计算最近K次平均值时,可以使用队列存储最近K次的数据,计算时将队列中的数据加总后再求平均值。
- 广度优先搜索:在搜索算法中,使用队列实现广度优先搜索,对于每个搜索到的节点,将其邻接节点放到队列中以便下一轮扩展。
- 缓存:队列也可以用于实现简单的缓存系统,将新到的数据加入队列,缓存达到容量时删除最老的数据。
总之,队列在许多算法和系统中都有着重要的应用,是非常基础和经典的数据结构之一。
第五章:树
5.1 树的定义与特点
树是一种抽象数据类型,它由n个节点组成,每个节点包含一个值和若干指向子节点的指针。在树中,有且仅有一个称为根的节点,它没有父节点,其他节点都有恰好一个父节点。每个节点有可能有若干个子节点,如果一个节点有子节点,那么它就是父节点,子节点则是它的子节点。
树的特点可以总结为以下几点:
- 树中节点的个数为n(n>=0)。
- 有且仅有一个根节点,没有父节点。
- 根节点可能有若干个子节点,每个子节点和父节点具有相同的结构,可以递归地定义它的子节点。
- 除了根节点,每个节点恰好有一个父节点。
- 从任意节点到根节点都有唯一路径。
- 树中节点没有顺序。
除此之外,树在任何情况下都不能有环路。任何一个节点到自己的路径不能经历同一个节点。以此完善了树的定义和特性。
5.2 二叉树的定义与特点
二叉树是一种特殊的树,它的每个节点最多有两个子节点,分别称为左子节点和右子节点,且左子节点和右子节点的顺序不能交换。
二叉树的定义可以总结为以下几点:
- 二叉树中的每个节点至多有两个子节点。
- 左子节点在二叉树中永远位于右子节点的左侧。
- 二叉树具有递归性质,即它的左子树和右子树也是二叉树。
- 二叉树中每个节点的左、右子树都是顺序的。
二叉树的特点是它的每个节点最多只有两个子节点,相比一般树而言,简化了树的结构,方便了节点的表示和操作。二叉树在计算机科学中应用广泛,常见的二叉树有二叉搜索树、平衡二叉树、满二叉树
等。
5.3 二叉树的遍历方法
二叉树的遍历方法包括前序遍历、中序遍历、后序遍历和层次遍历。
1. 前序遍历
前序遍历的顺序是:根节点 -> 左子树 -> 右子树
。具体实现时,我们先输出根节点,然后递归遍历左子树和右子树。
2. 中序遍历
中序遍历的顺序是:左子树 -> 根节点 -> 右子树
。具体实现时,我们先递归遍历左子树,然后输出根节点,最后递归遍历右子树。
3. 后序遍历
后序遍历的顺序是:左子树 -> 右子树 -> 根节点
。具体实现时,我们先递归遍历左子树,然后递归遍历右子树,最后输出根节点。
4. 层次遍历
层次遍历是从根节点出发,每层从左到右访问节点。具体实现时,我们可以借助队列,先将根节点入队,然后每次取出队列的头部元素(即当前层最左边的节点),输出其值,然后将它的子节点从左到右依次入队,重复以上步骤直至队列为空。
以上四种遍历方式都可以利用递归和迭代的方式进行实现,是二叉树遍历的标准方法。
5.4 平衡树、红黑树与B树
平衡树、红黑树和B树都是数据结构中常用的一种树形数据结构,用于实现在其上进行快速查找、插入和删除等常用操作。
1. 平衡树
平衡树是指具有自平衡性质的二叉搜索树,其左子树和右子树的深度之差不超过1。常见的平衡树有AVL树、红黑树等。
2. 红黑树
红黑树是一种自平衡二叉搜索树,可以在保持二叉搜索树特性的同时,保证任何一个节点的左右子树的高度相差不会超过二倍,从而保证其高效的查找、插入和删除操作。红黑树不同于其他平衡树,它使用着五个规则保持平衡,并且对插入、删除等操作还有着多重平衡调整策略。
3. B树
B树是一种平衡搜索树,多用于文件系统以及数据库系统中。B树属于多路平衡查找树,满足特定的平衡条件。B树将节点按照固定的次序存储在磁盘序列上,以便顺序地进行遍历和查找。B树的节点可能拥有更多的儿子,并且可以容纳更多的索引项,相比于平衡树,B树具有更高的磁盘读写速度和输入输出效率。
5.5 树的应用场景
树在计算机科学中非常广泛,常见的应用场景有:
- 文件系统:计算机中的文件系统通常采用树状结构来组织文件和目录,根目录为树的根节点,目录和文件为树的子节点。
- 数据库索引:在数据库系统中,索引通常采用树形结构来组织数据,常见的有B+树、B树等,可以大大提高数据查询效率。
- 无线通信:在无线通信中,树被用作通信网络的拓扑结构,可以实现分布式连接和高效的数据传输。
- 程序执行流程:程序执行流程通常采用树状结构来描述,每个节点代表一个执行节点,子节点则代表该节点的执行分支。
- 机器学习:决策树是一种非常重要的机器学习算法,它将训练数据组织成树形结构,以便进行分类和回归分析。
总之,树结构作为一种非常基础和通用的数据结构,被广泛应用于各种领域中,包括计算机科学、工程、自然科学、社会科学、医学等。
第六章:图
6.1 图的定义与特点
图是由若干个节点(vertex或node)和它们之间的连接边(edge)组成的抽象数学模型。图论是一门研究图的性质和应用的学科。
图的定义特点如下:
- 由节点和边组成:图是由一组节点和节点之间的连接边组成的。
- 有向或无向:边可以是有向或无向的,有向边有起点和终点,无向边没有方向。
- 同构或异构:两个图如果节点和边的数目相同,而且它们之间的对应关系保持不变,那么这两个图就是同构的;否则就是异构的。
- 边可以带有权重:有些图中的边是带有权重的,表示节点之间的距离或者边的权值。
- 有多种不同的表示方法:图可以用邻接矩阵、邻接表等不同的数据结构进行表示和操作。
图的应用非常广泛,主要在网络、社交网络、电路、计算机科学、优化理论
等领域。许多算法、模型和技术都以图论为基础,如最短路径算法、最小生成树算法、图像处理、搜索引擎
等等。
6.2 图的遍历方法
图的遍历是指按照某种规则依次访问图中所有节点的过程。
常见的两种遍历方法是深度优先遍历和广度优先遍历。
1. 深度优先遍历(Depth First Search,DFS)
深度优先遍历是从一个确定的起点开始,按照深度优先的原则对图进行遍历,即先深度优先遍历一个分支中的所有节点,再回溯到前一个未访问的状态,遍历下一个节点分支。
具体实现方式:可以使用递归或者栈等结构实现。从起点出发,访问该节点并标记已访问,再遍历该节点的所有邻节点,如果邻节点未被访问,则递归访问该邻节点,直到所有节点都被访问。
2. 广度优先遍历(Breadth First Search,BFS)
广度优先遍历是从一个确定的起点开始,按照广度优先的原则对图进行遍历,即先遍历当前节点的所有未访问邻居,然后再按照顺序遍历每个邻居的未访问邻居。
具体实现方式:可以使用队列等结构实现。从起点出发,访问该节点并标记已访问,并将其所有邻居加入队列,然后按照队列中的顺序,逐个出队并遍历其未访问的邻居,直到所有节点都被访问。
深度优先遍历和广度优先遍历各自有自己的应用场景。深度优先遍历适合查找一条路径,而广度优先遍历适合查找最短路径或最少步数等。
6.3 最短路径算法
最短路径算法是指在图中找到两个节点之间最短的路径的算法。一般来说,最短路径算法是以图的节点之间的边有权重,且权值非负为前提的。
下面介绍两种常见的最短路径算法:Dijkstra算法和Floyd算法。
1. Dijkstra算法
Dijkstra算法用于求解从源节点到所有其他节点的最短路径,其核心思想是贪心算法,即每次选择与源节点最近的一个节点作为中间点,计算出从源节点到该节点所有可能路径的最短路径,然后以该节点作为中间点继续计算,直到所有节点都被考虑。
具体实现方式:
- 首先构造一个节点集合,节点集合中只包含源节点。
- 然后将与源节点相邻的所有节点加入节点集合,计算它们到源节点的距离。
- 从节点集合中选择距离最短的节点,将其加入集合。
- 针对每个新加入的节点,更新源节点到其他节点的距离,并在节点集合中选择距离最短的节点。
2. Floyd算法
Floyd算法用于求解图中任意两个节点之间的最短路径,其核心思想是动态规划,即在当前节点之间考虑所有可能经过中转点的路径,如果从起点到终点之间经过某个中转点的路径比不经过该中转点的路径更优,则更新路径。
具体实现方式:
- 构造节点之间的邻接矩阵,并初始化矩阵中每一对节点之间的距离。
- 对于每一对节点之间的距离,尝试通过新加入的节点k,更新源节点i和目标节点j之间的路径距离。
- 遍历所有节点k,以k作为中间节点进行路径更新。
- 最终得到任意节点之间的最短路径。
总之,Dijkstra和Floyd都是常用的最短路径算法,具有高效且正确的特点,通常用于地图路线规划、网络路由和数据通信、邮路等导航和排程问题。
6.4 查找算法
查找算法指的是在一个数据集中查找指定的元素。
常见的查找算法有线性查找、二分查找、哈希查找等。
线性查找,也称顺序查找,是最简单的一种查找算法,从数据集的一端开始依次扫描,逐个比较元素是否匹配。当找到匹配的元素时返回该元素的位置,否则返回指定的未找到标志。其时间复杂度为O(n)。
二分查找,也称折半查找,是一种高效的查找算法。它需要在有序数据集上进行,在每次查找过程中,将数据集一分为二,判断目标元素是否在其中一半,若存在则继续在该半部分查找,否则在另一半查找。重复这个过程直到找到目标元素或确定不存在。其时间复杂度为O(log n)。
哈希查找,也称散列查找,是通过将元素的键值转换成数据集内的一个位置索引,从而快速地定位目标元素的查找算法。它需要一个哈希函数将元素的键值转换成对应的数组下标,并且需要解决哈希冲突的问题。其时间复杂度一般为O(1)。
除了以上三种常见的查找算法,还有一些其他的查找算法,如插值查找、斐波那契查找、树表查找等。
6.5 图的应用场景
图是一种非常重要的数据结构,它在很多领域都有广泛的应用。
以下是几个常见的图的应用场景。
- 网络路由和拓扑结构:计算机网络中,路由机器使用图来寻找最短路径,工程师使用图来理解网络拓扑结构,以便进行优化和管理。
- 计算机图形学:计算机图形学是一门复杂的计算机科学领域,涉及到图形渲染、图像处理、视频效果和高级人工智能。图形学是利用图形化处理,将图形化的信息传达和理解。
- 社交网络:社交网络的精髓在于链接和互动,通过图来表示个人和组织之间的关系、兴趣、影响和重要性等可以帮助我们理解社交网络的运作方式、可视化数据和提高分析性能。
- 数据库领域:数据库中的关系型模型可以用图来表示天然的关联和联系,如论文引用、产品关系、知识图谱等,可以更好的深入理解和查询数据。
- 程序设计:程序设计中涉及很多图算法,例如最短路径、最小生成树、拓扑排序、最大流等,图算法可以用来解决很多问题,如旅行推销员的问题,调度的问题和优化问题等。
总之,图的应用领域十分广泛,包括计算机科学、社交网络、人工智能、金融、医学等,对其进行建模、分析和可视化可以帮助人们更好地理解和优化各种复杂系统。
第七章:排序算法
7.1 插入排序
插入排序是一种简单直观的排序算法,它的排序思路是将一个待排序的数列分成有序和无序两部分,从无序部分取出一个元素,在有序部分从后向前扫描,找到合适的位置插入该元素,直到所有元素都有序排列。
插入排序的具体实现如下:
- 从第一个元素开始,该元素可以认为已经被排序
- 取出下一个元素,在已经排序的元素序列中从后向前扫描
- 如果该元素(已排序)大于新元素,将该元素移到下一位置
- 重复步骤3,直到找到已排序的元素小于或等于新元素的位置
- 将新元素插入该位置后
- 重复步骤2~5,直到排序完成
插入排序算法的时间复杂度为O(n^2)。在实际应用中,由于插入排序算法基于比较并交换元素,对于小规模的数据集,插入排序算法是非常高效的。而对于大规模的数据集合,插入排序算法效率比较低,可以考虑选择其他更优化的排序算法。
下面是使用JavaScript实现插入排序算法的代码:
function insertSort(arr) { var len = arr.length; for (var i = 1; i < len; i++) { var temp = arr[i]; var j = i - 1; while (j >= 0 && arr[j] > temp) { arr[j + 1] = arr[j]; j--; } arr[j + 1] = temp; } return arr; }
代码解析:
- 首先定义一个 insertSort 函数来实现插入排序算法;
- 首先获取数组 arr 的长度 len;
- 利用 for 循环来遍历 arr 数组,且从 1 开始,因为将第一个元素看成已排序;
- 定义一个变量 temp 来保存当前需要比较的元素,将当前元素与之前已排序的元素比较,若当前元素小,则将往后移动一位,否则停止循环;
- 在最后的空位插入当前元素 temp;
- 遍历完数组后返回排序好的数组。
这段代码实现了插入排序算法,并对数组进行了升序排序。
【利用AI让知识体系化】3万多字让你&我快速入门数据结构与算法(二)https://developer.aliyun.com/article/1426052