【数据结构和算法】线性表的查找算法(顺序查找,二分查找,插值查找,分块查找)

简介: 【数据结构和算法】线性表的查找算法(顺序查找,二分查找,插值查找,分块查找)

基础概念


平均查找长度:关键字的平均比较次数(ASL)

image.png

查找过程中需要注意的问题:

image.png

(重点主要就是在增加了约束关系的基础上提高查找的效率。)


顺序查找算法


应用范围

  • 顺序表或线性链表表示的静态查找表
  • 表内元素之间无序


顺序表的表示

typedef struct{
  KeyType key;  //关键字域
  ......    //其他域
}ElemType;
typedef struct{  //顺序表结构类型定义
  ElemType *R;  //表基址
  int lenght;  //表长
}SSTable;
SSTable ST;   //定义顺序表ST


算法表示形式1(已改进)

int Search_Seq(SSTable ST,KeyType key){
  for(i = ST.lenght; ST.R[i].key != key && i > 0; --i); //每次循环需要比较两次
  if( i > 0) return i;
  else return 0;
}


但是,这个小算法每一次循环都要进行两次比较,是否能改进。

  • 改进:设置监视哨的顺序查找

把待查关键字key存入表头(哨兵),从后往前比较。可免去查找过程中每一步都要检测是否查找完毕,加快速度。

  • 算法表示形式2(未改进)
int Search_Seq(SSTable ST,KeyType key){
  ST.R[0].key = key;
  for(i = ST.lenght; ST.R[i].key != key; --i);  //每次循环只需要比较一次
  return i;
}


  • 效果

当ST.lenght较大时,此改进能使进行一次查找所需的平均时间几乎减少一半。

  • 时间效率分析

image.png

假设一共有n个元素,由于是从后往前查找,所以最后的元素查找最快快,第一次就查找出来,如图所示,可见比较次数与key位置有关。

  1. 查找地i个元素需要比较n-i+1次
  2. 查找失败,需要比较n+1次


  • 时间复杂度与空间复杂度

image.png

(其中每个记录被查找的都是1/n,而n个元素总共需要查找的次数是1+2+…+n,所以时间复杂度为(n+1)/2)


  • 两个问题与解决方法

image.png

  • 优点与缺点

优点:算法简单,逻辑次序无要求,且不同存储结构均适用

缺点:ASL太长,时间效率太低


折半查找算法


  • 折半查找:每次将待查记录所在区间缩小一半
  • 思路:(非递归实现)

image.png

  • 算法实现
  1. 非递归实现
int Search_Bin(SSTable ST,KeyType key){
  low = 1; high = ST.lengh;  //置区间初值
  while(low <= high){
  mid = (low + high)/2;
  if(ST.R[mid].key == key)  //找到待查元素
    return mid;
  else if(key < ST.R[mid].key)//缩小查找区间
    high = mid - 1;   //继续在前半区间进行查找
  else
    low = mid + 1;    //继续在后半区间进行查找
  return 0;     //顺序表中不存在待查元素
  }
}


  1. 递归实现
int Search_Bin(SSTable ST,KeyType key,int low,int high){
  if(low > high)  //查找不到时返回0
  return 0;
  mid = (low + high)/2;
  if(key == ST.elem[mid].key)
  return mid;
  else if(key < ST.elem[mid].key)
  Search_Bin(ST,key,low,mid-1); //递归,在前半区进行查找
  else
  Search_Bin(ST,key,mid+1,high);  //递归,在后半区进行查找
}


  • 性能分析

image.png

根据表格,可以生产一个二叉树,表示最快到最慢的节点。

ps:路径上的结点数 = 结点的层数,比较的次数一定是 <= 树的深度的。对于这11个元素,每个元素的概率都相等,是1/11,而查找的总数为11+22+43+44 = 33,所以平均查找长度ASL = 33/11 = 3。比顺序查找的算法好。


  • 时间复杂度分析- log2n

image.png

  • 优点与缺点

优点:效率比顺序查找高

缺点:只适用于有序表。且限于顺序存储结构(对线性链表无效)。


插值查找


  • 条件

线性表中的记录必须是关键字有序(通常从小到大),线性表必须采用顺序存储取中

间记录作为比较对象,若给定值与中间记录的关键字相等,则查找成功;若给定值小于中间记录的关键字,则在中间记录左半区继续查找;否则,在右半区查找。不断重复,


ps:插值查找是在二分查找的基础上优化来的,他将二分查找中的中间记录“(low+high)/2”->>> low + (key - a[low])/(a[high] - a[low])*(high - low);//这个的意思其实是 low 加上key 在整个长度的比例乘以整个长度来作为其在序列的偏移量来作为二分查找中“mid”作为中间记录。所以此处不再分析。

  • 时间复杂度 O(log 2 (log 2 n))
  • 算法实现
int Search_Bin(SSTable ST,KeyType key){
  low = 1; high = ST.lengh;  //置区间初值
  while(low <= high){
  pos = ((key - ST.R[low].key)/(ST.R[high].key - ST.R[low].key)) * (high - low) + low;  
  //pos = (mid + high)/2;  //只需要改变这句
  if(ST.R[pos].key == key)  //找到待查元素
    return pos;
  else if(key < ST.R[pos].key)//缩小查找区间
    high = pos - 1;   //继续在前半区间进行查找
  else
    low = pos + 1;    //继续在后半区间进行查找
  return 0;     //顺序表中不存在待查元素
  }
}


  • 小结

插值查找和二分查找是类似的,只不过插值查找是从自选的点pos开始而二分查找是从规定好的mid中间开始。


分块查找算法


  • 分块查找,索引顺序表的查找
  • 条件

image.png

ps:

分块有序是之指,块之间是有序的,但是块内是无序。

索引表中另外一个数据存储的是块中的首地址。


  • 查找过程:

image.png

例子:

加入在上述的例子中,我想要查找38,接下来在索引表中进行比较,由于第一块的最大值只有22,所以不符合条件;第二块的最大值是48,比38大,所以38就是存储在第二块内容中,在索引表中还得知第二块的起始地址是7,所以从元素7开始进行顺序查找,找了4次之后,成功找到38。

算法实现

struct index    //定义块的结构
{
  int key;  //块的关键字
  int start;  //块的起始值
  int end;  //块的结束值
}index_table[4]; //定义结构体数组
int block_search(int key,int a[]) //自定义实现分块查找
{
  int i = 1,j;
  while(i<=3&&key>index_table[i].key)   //确定在哪个块中
  i++;
  if(i>3)      //大于分得的块数,则返回 0
  return 0;
  j=index_table[i].start;  //j 等于块范围的起始值
  while(j<=index_table[i].end&&a[j]!=key) //在确定的块内进行顺序查找
  j++;
  if(j>index_table[i].end)  //如果大于块范围的结束值,则说明没有要査找的数
  return 0;
}


  • 时间复杂度 O(logn)

image.png

  • 优点与缺点

优点:插入和删除比较容易,无需进行大量的移动

缺点:要增加一个索引表的存储空间并对初始索引表进行排序运算

适应情况:如果线性表既要快速查找又经常动态变化,则可采用分块查找


查找方法的比较

image.png

参考链接:https://space.bilibili.com/40323036

目录
相关文章
|
9月前
|
存储 监控 安全
企业上网监控系统中红黑树数据结构的 Python 算法实现与应用研究
企业上网监控系统需高效处理海量数据,传统数据结构存在性能瓶颈。红黑树通过自平衡机制,确保查找、插入、删除操作的时间复杂度稳定在 O(log n),适用于网络记录存储、设备信息维护及安全事件排序等场景。本文分析红黑树的理论基础、应用场景及 Python 实现,并探讨其在企业监控系统中的实践价值,提升系统性能与稳定性。
572 1
|
9月前
|
存储 监控 算法
基于跳表数据结构的企业局域网监控异常连接实时检测 C++ 算法研究
跳表(Skip List)是一种基于概率的数据结构,适用于企业局域网监控中海量连接记录的高效处理。其通过多层索引机制实现快速查找、插入和删除操作,时间复杂度为 $O(\log n)$,优于链表和平衡树。跳表在异常连接识别、黑名单管理和历史记录溯源等场景中表现出色,具备实现简单、支持范围查询等优势,是企业网络监控中动态数据管理的理想选择。
243 0
|
存储 算法 Java
算法系列之数据结构-二叉树
树是一种重要的非线性数据结构,广泛应用于各种算法和应用中。本文介绍了树的基本概念、常见类型(如二叉树、满二叉树、完全二叉树、平衡二叉树、B树等)及其在Java中的实现。通过递归方法实现了二叉树的前序、中序、后序和层次遍历,并展示了具体的代码示例和运行结果。掌握树结构有助于提高编程能力,优化算法设计。
413 10
 算法系列之数据结构-二叉树
|
算法 Java
算法系列之数据结构-Huffman树
Huffman树(哈夫曼树)又称最优二叉树,是一种带权路径长度最短的二叉树,常用于信息传输、数据压缩等方面。它的构造基于字符出现的频率,通过将频率较低的字符组合在一起,最终形成一棵树。在Huffman树中,每个叶节点代表一个字符,而每个字符的编码则是从根节点到叶节点的路径所对应的二进制序列。
403 3
 算法系列之数据结构-Huffman树
|
算法 Java
算法系列之数据结构-二叉搜索树
二叉查找树(Binary Search Tree,简称BST)是一种常用的数据结构,它能够高效地进行查找、插入和删除操作。二叉查找树的特点是,对于树中的每个节点,其左子树中的所有节点都小于该节点,而右子树中的所有节点都大于该节点。
558 22
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
1203 10
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
390 59
|
10月前
|
编译器 C语言 C++
栈区的非法访问导致的死循环(x64)
这段内容主要分析了一段C语言代码在VS2022中形成死循环的原因,涉及栈区内存布局和数组越界问题。代码中`arr[15]`越界访问,修改了变量`i`的值,导致`for`循环条件始终为真,形成死循环。原因是VS2022栈区从低地址到高地址分配内存,`arr`数组与`i`相邻,`arr[15]`恰好覆盖`i`的地址。而在VS2019中,栈区先分配高地址再分配低地址,因此相同代码表现不同。这说明编译器对栈区内存分配顺序的实现差异会导致程序行为不一致,需避免数组越界以确保代码健壮性。
219 0
栈区的非法访问导致的死循环(x64)
|
存储 C语言 C++
【C++数据结构——栈与队列】顺序栈的基本运算(头歌实践教学平台习题)【合集】
本关任务:编写一个程序实现顺序栈的基本运算。开始你的任务吧,祝你成功!​ 相关知识 初始化栈 销毁栈 判断栈是否为空 进栈 出栈 取栈顶元素 1.初始化栈 概念:初始化栈是为栈的使用做准备,包括分配内存空间(如果是动态分配)和设置栈的初始状态。栈有顺序栈和链式栈两种常见形式。对于顺序栈,通常需要定义一个数组来存储栈元素,并设置一个变量来记录栈顶位置;对于链式栈,需要定义节点结构,包含数据域和指针域,同时初始化栈顶指针。 示例(顺序栈): 以下是一个简单的顺序栈初始化示例,假设用C语言实现,栈中存储
892 77
|
10月前
232.用栈实现队列,225. 用队列实现栈
在232题中,通过两个栈(`stIn`和`stOut`)模拟队列的先入先出(FIFO)行为。`push`操作将元素压入`stIn`,`pop`和`peek`操作则通过将`stIn`的元素转移到`stOut`来实现队列的顺序访问。 225题则是利用单个队列(`que`)模拟栈的后入先出(LIFO)特性。通过多次调整队列头部元素的位置,确保弹出顺序符合栈的要求。`top`操作直接返回队列尾部元素,`empty`判断队列是否为空。 两题均仅使用基础数据结构操作,展示了栈与队列之间的转换逻辑。

热门文章

最新文章