一、概念和术语
数据、数据元素、数据项和数据对象
数据:
对客观事物的符号表示,在计算机可选中式指所能输入到计算机中并被计算机程序处理的符号的总称,他是计算机程序加工的“原料”
数据元素和数据项:
数据元素是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。一个数据元素可以是不可分割的原子,也可以是具有多礼含义的最小数据单位,也称之为字段或数据域
数据对象:
数据对象是性质相同的数据元素的集合,它是数据的一个子集
数据元素的集合无论是有限集合或是无限集合,只要集合内元素性质相同,都可以成为一个数据对象。
数据关系:
在数据对象中个数据元素之间存在着某种关系,这种关系反映了数据对象中数据元素所固有的一种关系,这就是数据关系
关键字:
指是数据元素中能够起标识作用的数据项。其种能够其唯一标识作用的关键字成为主关键字
二、数据结构
数据结构(data structure)是带有结构特性的数据元素的集合,它研究的是数据的逻辑结构和数据的物理结构以及它们之间的相互关系,并对这种结构定义相适应的运算,设计出相应的算法,并确保经过这些运算以后所得到的新结构仍保持原来的结构类型。简而言之,数据结构是相互之间存在一种或多种特定关系的数据元素的集合,即带“结构”的数据元素的集合。“结构”就是指数据元素之间存在的关系,分为逻辑结构和存储结构。
常用的数据结构
在计算机科学的发展过程中,数据结构也随之发展。程序设计中常用的数据结构包括如下几个。
数组(Array)
数组是一种聚合数据类型,它是将具有相同类型的若干变量有序地组织在一起的集合。数组可以说是最基本的数据结构,在各种编程语言中都有对应。一个数组可以分解为多个数组元素,按照数据元素的类型,数组可以分为整型数组、字符型数组、浮点型数组、指针数组和结构数组等。数组还可以有一维、二维以及多维等表现形式。
栈( Stack)
栈是一种特殊的线性表,它只能在一个表的一个固定端进行数据结点的插入和删除操作。栈按照后进先出的原则来存储数据,也就是说,先插入的数据将被压入栈底,最后插入的数据在栈顶,读出数据时,从栈顶开始逐个读出。栈在汇编语言程序中,经常用于重要数据的现场保护。栈中没有数据时,称为空栈。
队列(Queue)
队列和栈类似,也是一种特殊的线性表。和栈不同的是,队列只允许在表的一端进行插入操作,而在另一端进行删除操作。一般来说,进行插入操作的一端称为队尾,进行删除操作的一端称为队头。队列中没有元素时,称为空队列。
链表( Linked List)
链表是一种数据元素按照链式存储结构进行存储的数据结构,这种存储结构具有在物理上存在非连续的特点。链表由一系列数据结点构成,每个数据结点包括数据域和指针域两部分。其中,指针域保存了数据结构中下一个元素存放的地址。链表结构中数据元素的逻辑顺序是通过链表中的指针链接次序来实现的。
树( Tree)
树是典型的非线性结构,它是包括,2个结点的有穷集合K。在树结构中,有且仅有一个根结点,该结点没有前驱结点。在树结构中的其他结点都有且仅有一个前驱结点,而且可以有两个后继结点,m≥0。
图(Graph)
图是另一种非线性数据结构。在图结构中,数据结点一般称为顶点,而边是顶点的有序偶对。如果两个顶点之间存在一条边,那么就表示这两个顶点具有相邻关系。
堆(Heap)
堆是一种特殊的树形数据结构,一般讨论的堆都是二叉堆。堆的特点是根结点的值是所有结点中最小的或者最大的,并且根结点的两个子树也是一个堆结构。
散列表(Hash)
散列表源自于散列函数(Hash function),其思想是如果在结构中存在关键字和T相等的记录,那么必定在F(T)的存储位置可以找到该记录,这样就可以不用进行比较操作而直接取得所查记录。
逻辑结构:
逻辑结构元素决定输入、存储、发送、处理和信息传递的基本操作功能,常将逻辑结构元素称为逻辑模块。逻辑结构元素可以是计算机操作系统、终端模块、通信程序模块等。逻辑结构元素还可以是相关的几个逻辑模块联合起来的更复杂的实体。分析逻辑结构元素的相互作用,应考虑整个系统的操作,研究处理与信息流有关的进程(操作系统中的一个概念,表示程序的一次执行),并决定系统的逻辑资源
根据数据元素之间不同的关系特性,通常有4类基本结构类型
集合:
在该数据结构中,只有数据元素,他们之间除了“同属一个集合”外无其他的关系,即R = {}
集合是数据结构中 的一种特例
线性结构:
在该数据结构中,除了第一个元素外,其他各元素有唯一的前驱,除最后一个数据元素外,其他各元素有唯一的后继
树形结构:
在该数据结构中,除了一个根数据元素(结点)外,其他各元素(结点)都可以有多个后继。数据结构中的数据元素之间存在一对多的关系
图状结构或网状结构:
在该数据结构中,各数据元素可以有多个前驱或后继。根据结构中的数据元素之间存在多对多的关系
存储结构:
数据元素之间的关系有两种不同的表示方法:顺序映象和非顺序映象,并由此得到两种不同的存储结构:顺序存储结构和链式存储结构。数据的存储结构是指数据的逻辑结构在计算机中的表示。
根据在存储器中表示数据关系的不同,通常有4种存储方式:
顺序存储方式:
把逻辑上相邻的数据元素存储在物理位置上相邻的存储单位里,数据元素之间的逻辑关系由存储单元的邻接关系来体现。由此得到的存储表示成为顺序存储结构
链式存储方式:
不要求在逻辑上相邻的数据元素其物理位置相邻,数据元素之间的逻辑关系勇敢附加的指针字段来表示,由此得到的存储表示称为链式存储结构
索引存储方式:
在存储数据元素信息时,建立附加的索引表,索引表中的每一项称之为索引项,索引项时能够唯一标识一个数据元素的数据项目
如果一组数据元素子啊索引表中只对应一个索引项,则该索引表成为稀疏索引
如果一组数据元素子啊索引表中都有一个索引项,则该索引表成为稠密索引
哈希存储方式:
根据数据元素的关键字直接计算出该数据元素的存储地址。由此得到的存储表示为哈希存储结构
常用算法:
数据结构研究的内容:就是如何按一定的逻辑结构,把数据组织起来,并选择适当的存储表示方法把逻辑结构组织好的数据存储到计算机的存储器里。算法研究的目的是为了更有效的处理数据,提高数据运算效率。数据的运算是定义在数据的逻辑结构上,但运算的具体实现要在存储结构上进行。一般有以下几种常用运算:
(1)检索。检索就是在数据结构里查找满足一定条件的节点。一般是给定一个某字段的值,找具有该字段值的节点。
(2)插入。往数据结构中增加新的节点。
(3)删除。把指定的结点从数据结构中去掉。
(4)更新。改变指定节点的一个或多个字段的值。
(5)排序。把节点按某种指定的顺序重新排列。例如递增或递减。
存储结构时数据及其关系在计算机的存储表示。同一逻辑结构可以采用不同的存储方式,即可对应不同的数据结构
线性表:
若采用顺序存储方式,则可以称为顺序表
若采用链式存储方式,则可以成为链表
若采用散列存储方式,则可以成为散列表
三、数据类型与抽象数据类型
数据类型:
数据类型(Data Type)是和数据结构密切相关的一个概念。它最早出现在高级程序设计语言中,用以描述(程序)操作的对象的特性
按照“值”的不同特性,高级程序设计语言中的数据类型可分为两类:
原子类型:原子类型的值是不可被分解
结构类型:结构类型的值是若干成分按照某种结构组成的,因此是可分级的,并且它的成分可以是非结构的,也可以是结构的。
一个数据元素如果包含一个数据项,则数据项的类型就是该数据元素的类型,
否则数据元素的类型有各数据类型构造而成的构造类型,通常称之为“结构体类型”
抽象数据类型:(Abstract Data type,简记ADT)
一个数据结构加上定义在这个数据结构上的一组操作,即构成一个抽象数据类型的定义。抽象数据类型的概念其实质和程序设计语言中的数据类型概念相同。
抽象数据类型的定义仅取决于它的一组逻辑特性,而与其在计算机内部如何表示和实现无关, 即不论其内部结构如何变化,只要它的数学特性不变,都不影响其外部的使用