【数据结构与算法】—算法与算法分析(一)

简介: 【数据结构与算法】—算法与算法分析(一)

一、数据

数据是能输入计算机且能被计算机处理的各种符号的集合;是信息的载体,是对客观事物符号化的表示;能够被计算机识别,存储和加工

数据包括:数值型的数据和非数值型的数据

数值型的数据:整数、实数。

非数值型的数据:文字、图像、图形、声音等。


二、数据元素


数据元素是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。


数据元素也简称为元素、或者称为记录、结点或顶点。


三、数据项

数据项是构成数据元素的不可分割的最小单位。

数据、数据元素、数据项三者之间的关系

四、数据对象

数据对象是性质相同的数据元素的集合,是一个数据的子集。

数据结构:是指相互之间存在一种或者多种特定关系的数据元素的集合。

数据结构包括以下三个方面的内容:

  • 数据元素之间的逻辑关系,也称为逻辑结构
  • 数据元素以及关系在计算机内存中的表示(又称为映像),称为数据的物理结构或者数据的存储结构

数据的运算和实现,即对数据元素可以试驾的操作以及这些操作在相应的存储结构上的表现。

五、数据结构的两个层次

逻辑结构

  • 描述数据元素之间的逻辑关系
  • 与数据的存储无关,独立于计算机

是从具体问题抽象出来的数据模型

物理结构

数据元素以及其关系在计算机存储器中的结构(存储方式);是数据结构在计算机中的表示

逻辑结构与存储结构的关系

存储结构是逻辑关系的映像与元素本身的映像

逻辑结构是数据结构的抽象,存储结构是数据结构的实现

六、 逻辑结构的种类

线性结构:有且仅有一个开始和一个终端的结点,并且所有结点都最多只有一个直接前趋和一个直接后继。例如:线性表、栈、队列、串

非线性结构:一个结点可能有多个直接前趋和直接后继。例如:树、图。

划分方式二—四类基本逻辑结构

  1. 集合结构:结构中的元素之间除了同属于一个集合的关系外,无任何其他关系。
  2. 线性关系:结构中的元素之间存在一对一的线性关系。
  3. 树形结构:结构中的数据元素之间存在着一对多的层次关系。
  4. 图状结构或者网状结构:结构中的元素之间存在着多对多的任意关系。

七、存储结构的种类

  1. 顺序存储结构:用一组连续的存储单元依次存储数据元素,数据元素之间的逻辑关系由元素的存储位置来表示。C语言中用数组来实现顺序结构。
    2.链式存储结构
    用一组任意的存储单元存储数据元素,数据元素之间的逻辑关系用指针来表示。C语言中用指针来实现链式存储结构。

3.索引存储结构

在存储节点信息的同时,还建立附加的索引表

4.散列存储结构

根据节点的关键字直接计算出该节点的存储地址

第二章:数据类型和抽象数据类型

数据类型:数据类型是一组性质相同的值的集合以及定义于这个值集合上的一组操作的总称。

抽象数据类型:是指一个数据模型以及定义在此数据模型上的一组操作。


抽象数据类型的形式定义:抽象数据类型可用(D,S,P)三元组表示

其中:

  • D是数据对象
  • S是D上的关系集
  • P是对D的基本操作集


一个抽象数据类型的定义格式如下:

数据对象,数据关系的定义用伪代码描述

基本操作的定义格式为:

第三节:抽象数据类型的表现与实现

第四节:算法与算法分析

算法的定义:对特定问题求解方法和步骤的一种描述,它是指令的有限序列,其中每个指令表示一个或者多个操作。

算法的描述

算法的特性:一个算法必须具备以下五个重要的特性:

  • 有穷性:一个算法必须总是在执行有穷步之后结束,且每一步都在有穷内完成。
  • 确定性:算法中的每一条指令必须有确切的含义,没有二义性,在任何条件下,只有唯一的一条执行路径,即对于相同的输入只能得到相同的输出。
  • 可行性:算法是可执行的,算法描述的操作可以通过已经实现的基本操作执行有限次来实现。
  • 输入:一个算法有零个或多个输入
  • 输出:一个算法有一个或多个输出
    算法设计的要求





一个好的算法首先要具备正确性,然后是健壮性,可读性、在几个方面都满足的情况下,主要考虑算法的效率

通过算法的效率来评判不同算法的优劣程度。

算法效率通过以下两个方面来考虑:

时间效率:是指算法所耗费的时间。

空间效率:指的是算法执行过程中所耗费的存储空间。

时间效率和空间效率有时候是矛盾的。

算法时间效率的度量

算法时间效率可以依据该算法编制的程序在计算机上执行所消耗的时间来度量。

两种度量方法

事后统计:将算法实现,测算其时间和空间开销

缺点:编写程序实现算法将花费较多的时间和精力,所得实验结果依赖于计算机的软硬件等环境因素,掩盖算法本身的优劣。

事前分析:对算法所消耗资源的一种估算方法(一般采用事前分析)


每条语句执行一次所需的时间,一般是随机器而异的,取决于机器的指令性能,速度,以及编译的代码质量,是由机器本身软硬件环境决定的,他与算法无关。

所以,我们可以假设执行每条语句所需要的时间均为单位时间,此时对算法的运行时间的讨论就可以转化为该算法中所有语句的执行次数,即频度之和。

• 1


为了便于比较不同算法的时间效率,我们仅比较他们的数量级

数量级越大的越不好

分析算法时间复杂度的基本方法

分析算法时间复杂度的基本方法

  • 找出语句频度最大的那条语句作为基本语句
  • 计算基本语句的频度得到问题规模n的某个函数f(n)
  • 取其数量级用符号"O"表示


算法的时间复杂度:

  • 最坏时间复杂度:指在最坏的情况下,算法的时间复杂度
  • 平均复杂度:指在所有可能输入实例在等概率出现的情况下,算法的期望运行时间。
  • 最好时间复杂度:指在最好情况下,算法的时间复杂度
  • 一般总是考虑在最坏情况下的时间复杂度,以保证算法的运行时间不会比它更长。

时间复杂度T(n)按数量级递增顺序为:

渐进空间复杂度

渐进空间复杂度:算法所需存储空间的度量

记作:S(n)=O(f(n));其中n为问题的规模(或大小)


相关文章
|
16天前
|
JSON 监控 算法
员工上网行为监控:利用Scala编写数据处理和分析算法
企业在数字化时代利用Scala进行员工上网行为监控,以确保合规和网络安全。通过Scala的数据处理和分析能力,读取CSV日志数据转换为DataFrame,分析员工行为,如统计最常访问网站。此外,还展示了将监控数据以JSON格式提交至公司网站的函数,实现实时信息更新与安全防护。
60 5
|
2天前
|
机器学习/深度学习 存储 算法
数据结构与算法 动态规划(启发式搜索、遗传算法、强化学习待完善)
数据结构与算法 动态规划(启发式搜索、遗传算法、强化学习待完善)
8 1
|
5天前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
5天前
|
搜索推荐 C语言
【C语言/数据结构】排序(归并排序|计数排序|排序算法复杂度)
【C语言/数据结构】排序(归并排序|计数排序|排序算法复杂度)
11 0
|
5天前
|
存储 算法
Leetcode 30天高效刷数据结构和算法 Day1 两数之和 —— 无序数组
给定一个无序整数数组和目标值,找出数组中和为目标值的两个数的下标。要求不重复且可按任意顺序返回。示例:输入nums = [2,7,11,15], target = 9,输出[0,1]。暴力解法时间复杂度O(n²),优化解法利用哈希表实现,时间复杂度O(n)。
16 0
|
11天前
|
机器学习/深度学习 算法 数据可视化
Matlab决策树、模糊C-均值聚类算法分析高校教师职称学历评分可视化
Matlab决策树、模糊C-均值聚类算法分析高校教师职称学历评分可视化
|
11天前
|
存储 索引
操作数栈的字节码指令执行分析
操作数栈的字节码指令执行分析
|
12天前
|
存储 算法 Java
22个常用数据结构实现与原理分析
前两天V哥跟一个老学员吃饭,聊起面试大厂的事,说为啥大厂面试第一看基本条件,第二就是考数据结构算法,其他高阶的内容会比较少,最近V哥也在跟大厂对接这一块业务,了解得多一些,这是因为考察基本功能力被放到了重要位置,大厂认为硬性条件,比如学历过关,基本功够扎实,那对于实际工作用的上层技能,内部培养就好,也就是相比你掌握了多少多少牛逼的高阶技术,他们更在乎你的基本功,所以,进大厂,基本功必须要搞稳,否则白扯,今天 V 哥把总结好的22个常用的数据结构实现原理,和示例分析分享给大家,希望对你有帮助,觉得内容有收获,请帮忙转发给更多需求的朋友,共同进步。
|
12天前
|
算法 搜索推荐 数据挖掘
MATLAB模糊C均值聚类FCM改进的推荐系统协同过滤算法分析MovieLens电影数据集
MATLAB模糊C均值聚类FCM改进的推荐系统协同过滤算法分析MovieLens电影数据集
|
12天前
|
算法 数据可视化 数据挖掘
数据分享|R语言改进的K-MEANS(K-均值)聚类算法分析股票盈利能力和可视化
数据分享|R语言改进的K-MEANS(K-均值)聚类算法分析股票盈利能力和可视化