《数据结构》学习笔记二:算法(一)

简介: 本节虽然名为“算法”,其实讲的只是算法的一些概念以及评估方式,并没有涉及很复杂的算法。解决问题:什么是算法算法的特性算法设计的要求如何评估一个算法的优劣通过本节的学习,我们可以轻松的解决这些问题。

本节虽然名为“算法”,其实讲的只是算法的一些概念以及评估方式,并没有涉及很复杂的算法。

解决问题:

  1. 什么是算法
  2. 算法的特性
  3. 算法设计的要求
  4. 如何评估一个算法的优劣

通过本节的学习,我们可以轻松的解决这些问题。

1.算法的概念

算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。

通俗的讲,算法就是解决问题的步骤。很多优秀的算法都是前人不断的总结,积累下来的求解特定问题的步骤。

我们在上一节中提到了

程序设计 = 数据结构 + 算法

那么算法与数据结构的关系就像梁山伯与祝英台,罗密欧与朱丽叶。数据结构和算法可以单独列出来讲解,但是把他们放在一起才会感受到前人的智慧。

2. 两种简单算法的比较

为了更加直观的感受到什么是算法,我们来举一个小例子。
问题:
计算 1+2+3+......+100 的和。
有些朋友该说了,这不是太简单了吗,不管使用哪种语言,都会很容易的想到这种简单的写法,在编译器立马写下如下代码:
(这里使用swift语言)

// 计算1到100的和
var sum = 0, n = 100
for i in 1...n {
    sum += i
}
print("sum = \(sum)")

很容易看明白吧。这其实也是一种算法,他就是一种解决求和问题的算法,至于优劣,我们后来再讨论。

我们这里插述一个大数学家高斯的故事。
高斯小时候,又一次老师出了一个题目,让同学们计算 1到100的和,就是上面我们解决的那个问题。高斯很快就计算出了结果,他是如何快速计算出结果的呢?

sum = 1 + 2 + 3 + ......+100
sum = 100 + 99 + 98 + ......+ 1
sum + sum = 101 + 101 + 101 + ......+101

共有 100个101 。
所以,

sum = (1 + n) * n / 2

上述的算法改进之后就变成了:

// 优化
var sum2 = 0, n2 = 100
sum2 = (1 + n2) * n2 / 2
print(sum2)

这样计算是不是快了很多?

3. 算法的特性

算法具有五个特性:

输入、输出、有穷性、可行性、确定性。

输入:
算法具有0个或者多个输入。

输出:
算法至少有一个输出。

有穷性:
算法必须会自动结束并且在可接受的时间范围内。

可行性:
算法的每一个步骤都是可行的,每一步都通过执行有限次数完成。

确定性:
相同的输入,只有唯一的输出结果。

4. 算法的设计要求

正确性、可读性、健壮性、时间效率高、存储量小。

正确性:
算法必须是正确的,能够解决问题,得到问题的正确答案。

可读性:
算法应该是便于阅读交流和理解的。

健壮性:
对于异常情况,都要有很好的兼容性。

时间效率高:
执行时间越短的算法越好。

存储量低:
占用内存越小的越好。

5. 算法效率的度量方法(时间复杂度)

算法的效率度量有两种方式:

  1. 事后统计方法
  2. 事前分析估算方法

事后统计方法:
通过设计好的测试程序和数据,利用计算机计时器对不同的算法运行时间进行比较,从而确定效率的高低。
这是一种很不精确的度量方式,误差会很大。
为什么?
因为这样的话,需要事前编制测试程序,花费大量的精力,如果算法不好,则又是白费力气。且时间的计算依赖计算机的硬件以及软件,计算机的软硬件是有差别的,而且运行不同的程序也会导致结果的不同。

事前分析估算方法

这是一种很科学的计算方式。
它是在计算机程序编制之前,依据统计方法对算法进行估算。

程序在计算机上运行所消耗的时间取决于以下的因素:
1.算法的策略(算法好坏的根本)
2.编译产生的代码量(编译器决定)
3.问题的输入规模
4.机器执行指令的速度(硬件性能)

所以,一个程序的运行时间,依赖于算法的好坏和问题的输入规模。

我们还来看之前的求和的例子:

var sum = 0, n = 100 ……执行 1 次
for i in 1...n { …..…………执行 n + 1次
sum += i ……... …………执行 n 次
}
print("sum = (sum)") ……执行 1 次

执行次数是

1 + (n +1) + n + 1 = 2n + 3 (次)

第二种算法

var sum2 = 0, n2 = 100 ············执行1次
sum2 = (1 + n2) * n2 / 2············执行1次
print(sum2)····························执行1次

执行次数是
1 + 1+ 1 = 3 (次)

显而易见,那种算法效率更高。

测定运行时间最可靠的方法就是计算运行时间有消耗的基本操作的执行次数,运行时间与整个次数成正比。

时间有限,本节暂时记录这些内容,下一篇文章中我们一起学习算法中函数的渐进增长、算法的时间复杂度、算法的空间复杂度等内容。
一起加油吧。

目录
相关文章
|
10月前
|
存储 监控 安全
企业上网监控系统中红黑树数据结构的 Python 算法实现与应用研究
企业上网监控系统需高效处理海量数据,传统数据结构存在性能瓶颈。红黑树通过自平衡机制,确保查找、插入、删除操作的时间复杂度稳定在 O(log n),适用于网络记录存储、设备信息维护及安全事件排序等场景。本文分析红黑树的理论基础、应用场景及 Python 实现,并探讨其在企业监控系统中的实践价值,提升系统性能与稳定性。
635 1
|
10月前
|
存储 监控 算法
基于跳表数据结构的企业局域网监控异常连接实时检测 C++ 算法研究
跳表(Skip List)是一种基于概率的数据结构,适用于企业局域网监控中海量连接记录的高效处理。其通过多层索引机制实现快速查找、插入和删除操作,时间复杂度为 $O(\log n)$,优于链表和平衡树。跳表在异常连接识别、黑名单管理和历史记录溯源等场景中表现出色,具备实现简单、支持范围查询等优势,是企业网络监控中动态数据管理的理想选择。
264 0
|
存储 算法 Java
算法系列之数据结构-二叉树
树是一种重要的非线性数据结构,广泛应用于各种算法和应用中。本文介绍了树的基本概念、常见类型(如二叉树、满二叉树、完全二叉树、平衡二叉树、B树等)及其在Java中的实现。通过递归方法实现了二叉树的前序、中序、后序和层次遍历,并展示了具体的代码示例和运行结果。掌握树结构有助于提高编程能力,优化算法设计。
437 10
 算法系列之数据结构-二叉树
|
算法 Java
算法系列之数据结构-Huffman树
Huffman树(哈夫曼树)又称最优二叉树,是一种带权路径长度最短的二叉树,常用于信息传输、数据压缩等方面。它的构造基于字符出现的频率,通过将频率较低的字符组合在一起,最终形成一棵树。在Huffman树中,每个叶节点代表一个字符,而每个字符的编码则是从根节点到叶节点的路径所对应的二进制序列。
420 3
 算法系列之数据结构-Huffman树
|
算法 Java
算法系列之数据结构-二叉搜索树
二叉查找树(Binary Search Tree,简称BST)是一种常用的数据结构,它能够高效地进行查找、插入和删除操作。二叉查找树的特点是,对于树中的每个节点,其左子树中的所有节点都小于该节点,而右子树中的所有节点都大于该节点。
581 22
|
存储 机器学习/深度学习 算法
C 408—《数据结构》算法题基础篇—链表(下)
408考研——《数据结构》算法题基础篇之链表(下)。
545 30
|
存储 算法 C语言
C 408—《数据结构》算法题基础篇—链表(上)
408考研——《数据结构》算法题基础篇之链表(上)。
817 25
|
存储 人工智能 算法
C 408—《数据结构》算法题基础篇—数组(通俗易懂)
408考研——《数据结构》算法题基础篇之数组。(408算法题的入门)
924 23
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
405 59
|
11月前
|
编译器 C语言 C++
栈区的非法访问导致的死循环(x64)
这段内容主要分析了一段C语言代码在VS2022中形成死循环的原因,涉及栈区内存布局和数组越界问题。代码中`arr[15]`越界访问,修改了变量`i`的值,导致`for`循环条件始终为真,形成死循环。原因是VS2022栈区从低地址到高地址分配内存,`arr`数组与`i`相邻,`arr[15]`恰好覆盖`i`的地址。而在VS2019中,栈区先分配高地址再分配低地址,因此相同代码表现不同。这说明编译器对栈区内存分配顺序的实现差异会导致程序行为不一致,需避免数组越界以确保代码健壮性。
232 0
栈区的非法访问导致的死循环(x64)