【查找算法】解析学习四大常用的计算机查找算法 | C++

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
简介: 在数据处理的过程中,能否在最短时间内去找到目的数据,是编程开发人员非常值得关心的一个问题。所谓查找,也被称为搜索,它是指从数据文件中找出满足某些条件的记录。在数据结构中描述算法时习惯用“查找”,而在搜索引擎中找信息或资料时习惯用“搜索”。我们在电话簿中查找某人的电话号码,电话簿就像是数据文件库,而姓名就是去查找电话号码的键值。我们经常使用的搜索引擎所设计的Spider程序(网页抓取程序爬虫)会主动经由网站上的超链接“爬行”到另一个网站,搜集每个网站上的信息并且收录到数据库中,这其中就涉及到了今天要讲的查找算法。

前言

       在数据处理的过程中,能否在最短时间内去找到目的数据,是编程开发人员非常值得关心的一个问题。所谓查找,也被称为搜索,它是指从数据文件中找出满足某些条件的记录。在数据结构中描述算法时习惯用“查找”,而在搜索引擎中找信息或资料时习惯用“搜索”。我们在电话簿中查找某人的电话号码,电话簿就像是数据文件库,而姓名就是去查找电话号码的键值。我们经常使用的搜索引擎所设计的Spider程序(网页抓取程序爬虫)会主动经由网站上的超链接“爬行”到另一个网站,搜集每个网站上的信息并且收录到数据库中,这其中就涉及到了今天要讲的查找算法。

查找算法

       在查找算法中,比较常见的有顺序法、二分法、插入法和斐波那契法等。查找的操作和算法有关,具体的操作方式和进行方式与所选择的数据结构有关。计算机查找数据的优点就是快速,但是对于不同程度下的数据量,查找可以分为内部查找(数据量较小的文件)和外部查找(数据量较大的文件)。影响查找时间长短的主要因素有算法,数据存储的方式以及结构。查找可以分为静态查找和动态查找。静态查找是指数据元素在查找的过程中不会有添加,删除,更新等操作。动态查找是指所查找的数据在查找过程中会经常地添加,删除或更新。

一、顺序查找

1.什么是顺序查找法?

(1)简要介绍

       顺序查找法是一种比较简单的查找法。该算法就是利用了计算机便于处理大量数据的这一特点,从而来进行实现的。该方法的优点就是文件在查找前不需要进行任何处理与排序;而缺点是查找的速度比较慢,因为无论数据顺序是什么情况,它都需要从头到尾都去遍历一遍。如果数据元素没有重复,那么找到数据元素就可以中止查找。说明最差的情况是n次查找,最好的情况下是1次查找。

(2)具体情况

       在8个数据元素中,去顺序查找元素89。情况如下图所示:

对于大量重复的数据元素来说,顺序查找法一般是不会使用的,因为它的时间效率极低并且可能会因为元素中的重复项而造成错误。但是对于少量的数据元素来说,这无疑是一种非常快又准确性高的简单方法。

(3)算法分析

       ①时间复杂度:如果数据没有重复且找到数据就可以中止,那么在最差情况下就是未找到数据,进行了n次比较,所以时间复杂度为O(n)。

       ②当数据量很大时,不适合使用顺序查找法。如果事先预估到所查找的数据在文件前面的部分,就可以减少查找的时间。

       ③在平均情况下,假设数据出现的概率相等,则需要进行(n+1)/2次比较。

2.案例实现

(1)范例情况:用随机法生成80个1~100的整数,用顺序查找法去查找我们指定元素是否存在,如果存在说明其所在的位置。

(2)代码展示:

#include<iostream>
#include<cstdlib>
using namespace std;
class order {
public:
  int data[80];
  int val = 0;
  //构造函数 随机给data中分配数据
  order() {
  for (int i = 0; i < 80; i++)
    data[i] = (rand() % 100) + 1;
  }
  void order_start() {
  cout << "请输入要猜测的数:";
  cin >> val;
  for (int i = 0; i < 80; i++)
  {
    if (data[i] == val) {
    cout << "该数" << data[i] << "存在 所在位置为" << i + 1 << endl;
    val = 0;
    }
  }
  if (val != 0)
    cout << "该数不存在" << endl;
  }
  //析构函数 展现所有元素
  ~order() {
  cout << "所有随机数据元素如下:" << endl;
  for (int i = 0; i < 80; i++) 
    cout << data[i] << "[" << i << "]" << " ";
  }
};
int main()
{
  order o;
  while (o.val != -1)
  {
  o.order_start();
  }
}

二、二分查找法

1.什么是二分查找法?

(1)简要介绍

       如果一组数据已经事先排好了顺序,那么就可以用二分查找法来进行查找。二分查找法的基本方法就是将数据分成两等份,比较目标寻找值与中间值的大小。如果小于中间值,那么我们就可以确定要寻找的数据在前半部分,否则在后半部分。重复上述步骤将其分割直到找到或确定不存在为止。

(2)具体情况

       用二分查找法对已经完成排序的一组数列,查找其元素101所在的位置。具体情况如下图所示:

(3)算法分析

       ①时间复杂度:因为每次的查找都会比上一次查找少一半的范围,所以最多只需比较(log2^n)+1或(log2^(n+1))次,时间复杂度O(log2^n)。

       ②二分查找法必须是经过排序的数列,且数据元素都要加载到内存中才能进行查找。

       ③二分查找法适用于不需要增删的静态数据。

2.案例实现

(1)范例程序:用二分查找法查找10个1~10随机数据中指定数据元素的位置,并且输出随机产生的这10个数据。

(2)代码展示:

#include<iostream>
using namespace std;
#define size 10
class dichotomy {
public:
  int data[size];
  int val = 0;
  dichotomy() {
  for (int i = 0; i < size; i++)
    data[i] = (rand() % 10) + 1;
  }
  void sort() {
  for (int i = 0; i < size-1; i++) {
    for (int j = i+1; j < size; j++) {
    if (data[i] > data[j])
    {
      int temp;
      temp = data[i];
      data[i] = data[j];
      data[j] = temp;
    }
    }
  }
  }
  void dichotomy_start(int len_left,int len_right){ 
  int record=0;
  while (len_left <= len_right )
  {
    int mid = (len_right + len_left) / 2;
    if (val < data[mid]) {
    cout << "目标数在中间值的左边" << endl;
    len_right = mid - 1;
    }
    else if (val > data[mid]) {
    cout << "目标数在中间值的右边" << endl;
    len_left = mid + 1;
    }
    else if(val==data[mid]){
    cout << "在第" << mid + 1 << "个位置处找到了" << "该元素" << data[mid] << endl;
    val = 1;
    break;
    } 
  } 
  if (val != 1) {
    cout << "随机产生的这几个数中不存在要猜测的这个数值" << endl;
  }
  }
  ~dichotomy() {
  cout << "所有随机数据元素如下:" << endl;
  for (int i = 0; i < size; i++) 
    cout << data[i] << "[" << i << "]" << " ";
  }
};
int main()
{
  dichotomy d;
  d.sort();
  while (d.val!=-1)
  {
  cout << "请输入要猜测的数:";
  cin >> d.val;
  if (d.val != -1)
    d.dichotomy_start(0, size - 1);
  else
    break;
  }
}

(3)结果展示:


三、插值查找法

1.什么是插值查找法?

(1)简要介绍

       插值查找法又被称为插补查找法,是对二分查找的进一步改进。它是按照数据位置的分布,利用公式去预测数据所在的位置,再用二分法的方式渐渐逼近。该查找法的公式如下:



其中,key是要去查找的键值,data[high],data[low]是剩余待查找记录中的最大值和最小值。特别注意:使用该查找算法之前需要对要排序的数据进行排序。


(2)具体情况

假设数据项为n,其插值查找法的步骤如下:

       ①讲记录从小到大的顺序给予1,2,...,n的编号;

       ②令low=1,high=n;

       ③当low

       ④令Mid=low+((key-data[low])/(data[high]-data[low]))*(high-low);

       ⑤若key

       ⑥若key>key[mid]且low≠Mid+1,则令low=Mid+1;

       ⑦若key=key[mid],则表示成功找到了键值的位置;


(3)算法分析

       ①插值查找法优于顺序查找法,如果数据的分布越平均,查找速度就越快,甚至可能第一次就找到数据。插值查找法的时间复杂度取决于数据的分布情况,平均而言优于O(log2^n)。

2.案例实现

①范例程序:用插值查找法去查找10个随机数据中,指定元素数据所在的位置。

②代码展示:

#include<iostream>
using namespace std;
class interpolation_search {
public:
  int data[10];
  int val = 0;
  interpolation_search() {
  for (int i = 0; i < 10; i++)
    data[i] = (rand() % 10) + 1;
  }
  void sort() {
  for (int i = 0; i < 10-1; i++)
  {
    for (int j = i + 1; j < 10; j++)
    {
    if (data[i] > data[j])
    {
      int temp;
      temp = data[i];
      data[i] = data[j];
      data[j] = temp;
    }
    }
  }
  }
  void interpolation_search_start() {
  int low = 0, high = 9;
  while (low<=high)
  {
    int mid = low + ((val - data[low]) / (data[high] - data[low])) * (high - low);
    if (val < data[mid]) {
    cout << "目标元素在mid的左边" << endl;
    high = mid - 1;
    }
    if (val > data[mid]) {
    cout << "目标元素在mid的右边" << endl;
    low = mid + 1;
    }
    if (val == data[mid]) {
    cout << "找到了该元素,该元素位置在" << mid + 1 << "处" << endl;
    val = 1;
    break;
    }
  }
  if (val != 1) {
    cout << "随机生成的数据中没有你要去查找的数据" << endl;
  }
  }
  ~interpolation_search() {
  cout << "随机产生的数据元素如下" << endl;
  for (int i = 0; i < 10; i++)
    cout << data[i] << " ";
  }
};
void text()
{
  interpolation_search is;
  is.sort();
  while (is.val != -1)
  {
  cout << "请输入你要查找的数:";
  cin >> is.val;
  is.interpolation_search_start();
  }
}
int main()
{
  text();
}

③结果展示:

四、斐波那契查找法

1.什么是斐波那契查找法?

(1)简要介绍

       斐波那契查找法又被称为斐氏查找法,该方法与二分法一样都是以分割范围来进行查找的,不同的是该方法不是以对半的方式来进行分割的,而是利用斐波那契级数(0、1、1、2、3、5、8、13、21、34、55、...)来进行分割的。该查找法的优点就是只需要用到加减运算,这从计算机运算的底层来看效率是相对较高的。并且该查找法会用到斐波那契树,所以我们应该先来了解该树的基本情况和特点。

(2)具体情况

斐波那契树的建立原则:

       ①斐波那契树的左右子树都是斐波那契树。

       ②斐波那契树的树根一定是一个斐波那契数,且子节点与父节点之间的差值的绝对值仍为斐波那契数。

       ③当k≥2时,斐波那契树的树根为Fib(k),左子树为(k-1)层斐波那契树,右子树为(k-2)层斐波那契树。

       ④当数据个数n确定时,若想确定斐波那契树的层数k为多少,必须找到一个最小的k值,使斐波那契层数的Fib(k+1)≥n+1。



也就是说当数据个数为n,我们找到一个最小的斐波那契数Fib(k+1)使得Fib(k+1)>n+1时,Fib(k)就是这棵树的树根,而Fib(k-2)就是与左右子树开始的差值,左子树去减,右子树去加。例如去求取n=33的斐波那契树。由于n=33,则n+1=34为一棵斐波那契树。由斐波那契公式可得知Fib(0)=0,Fib(1)=1,Fib(2)=1,Fib(3)=2,Fib(4)=3,Fib(5)=5,Fib(6)=8,Fib(7)=13,Fib(8)=21,Fib(9)=34。可知Fib(k+1)≥n+1为Fib(8+1)=34,k=8所以建立二叉树的树根为Fib(8)=21。左子树的树根为Fib(8-1)=13;右子树的树根为Fib(8)+Fib(8-2)=21+8=29;从而依照上述步骤建立的斐波那契树如下图所示:



若我们要查找的键值为key,首先要去比较数组下标Fib(k)和键值key,此时就将会出现多种情况如下:

       ①key值较小,落在了1~Fib(k)-1位置上,所以继续去查找1~Fib(k)-1的数据;key值较大,落在了Fib(k)+1~Fib(k+1)-1的位置上,所以继续去查找Fib(k)+1~Fib(k+1)-1的数据。

       ②当键值与数组下标Fib(k)的值相等时,则表示成功的查找到了目标数据元素的位置。

(3)算法分析

      ① 斐波那契查找法虽然平均比较次数少于二分查找法,但在最坏的情况下还是二分查找法较快,并且斐波那契查找法相对复杂,因为它需要去额外产生一棵斐波那契树。

2.案例实现

①范例程序:用斐波那契树查找法去查找指定键值是否存在,并且如果存在其在哪个具体的位置。

②代码展示:

#include<iostream>
using namespace std;
#define size 10
class Fib {
public:
  int data[size];
  int val = 0;
  Fib() {
  for (int i = 0; i < size; i++)
    data[i] = (rand() % 10) + 1;
  }
  int Fib_start(int n) {
  if (n == 0 || n == 1)
    return 1;
  else
    return Fib_start(n - 1) + Fib_start(n - 2);
  }
  int Fib_search_start() {
  int index = 2;
  while (Fib_start(index) <= size)
    index++;
  index--;
  int rootnode = Fib_start(index);
  int diff_1 = Fib_start(index - 1);
  int diff_2 = rootnode - diff_1;
  rootnode--;
  while (1)
  {
    if (val == data[rootnode])
    {
    return rootnode;
    }
    else
    {
    if (index == 2)
      return size;
    if (val < data[rootnode])
    {
      rootnode = rootnode - diff_2;
      int temp = diff_1;
      diff_1 = diff_2;
      diff_2 = temp - diff_2;
      index = index - 1;
    }
    else
    {
      if (index == 3)
      return size;
      rootnode = rootnode + diff_2;
      diff_1 = diff_1 - diff_2;
      diff_2 = diff_2 - diff_1;
      index = index - 2;
    }
    }
  }
  }
  ~Fib()
  {
  cout << "随机生成的所有数据情况如下" << endl;
  for (int i = 0; i < 10; i++)
    cout << data[i] << " ";
  }
};
void text()
{
  Fib f;
  while (f.val != -1)
  {
  cout << "请输入要查找的值:";
  cin >> f.val;
  int count = f.Fib_search_start();
  if(count==size)
    cout << "没有找到该数据元素" << endl;
  else
    cout << "在第" << count + 1 << "个位置找到了该数据元素" << f.val << endl;
  }
}
int main()
{
  text();
}

③结果展示:

总结

       以上就是我们对四类查找算法的分析与学习,查找算法在程序设计问题中经常作为一种重要中间的步骤。比如查找数据后,再对数据进行指定步骤的操作行为,所以要在不同的算法题型中合理地运用查找算法,从而达到最高的效率来解决相应的问题。



目录
相关文章
|
1月前
|
XML 监控 网络协议
云深处绝影四足机器人协议学习解析
本文详细介绍并解析了云深处绝影X20四足机器人的通信协议,包括TCP服务端端口号、基于Service的请求/响应通信机制、通信帧结构、消息类型、常见的通信示例如获取状态和导航请求,以及运动控制的参数和命令。文中还提出了对协议中某些未明确说明或可能存在的问题的疑惑。
29 0
云深处绝影四足机器人协议学习解析
|
3天前
|
XML JavaScript 前端开发
学习react基础(1)_虚拟dom、diff算法、函数和class创建组件
本文介绍了React的核心概念,包括虚拟DOM、Diff算法以及如何通过函数和类创建React组件。
14 2
|
1月前
|
安全 Java 数据库连接
后端框架的学习----mybatis框架(3、配置解析)
这篇文章详细介绍了MyBatis框架的核心配置文件解析,包括环境配置、属性配置、类型别名设置、映射器注册以及SqlSessionFactory和SqlSession的生命周期和作用域管理。
后端框架的学习----mybatis框架(3、配置解析)
|
1月前
|
机器学习/深度学习 人工智能 资源调度
【博士每天一篇文献-算法】连续学习算法之HAT: Overcoming catastrophic forgetting with hard attention to the task
本文介绍了一种名为Hard Attention to the Task (HAT)的连续学习算法,通过学习几乎二值的注意力向量来克服灾难性遗忘问题,同时不影响当前任务的学习,并通过实验验证了其在减少遗忘方面的有效性。
48 12
|
1月前
|
算法 Java
掌握算法学习之字符串经典用法
文章总结了字符串在算法领域的经典用法,特别是通过双指针法来实现字符串的反转操作,并提供了LeetCode上相关题目的Java代码实现,强调了掌握这些技巧对于提升算法思维的重要性。
|
1月前
|
人工智能 算法
AI 0基础学习,数学名词解析
AI 0基础学习,数学名词解析
14 2
|
1月前
|
算法 NoSQL 中间件
go语言后端开发学习(六) ——基于雪花算法生成用户ID
本文介绍了分布式ID生成中的Snowflake(雪花)算法。为解决用户ID安全性与唯一性问题,Snowflake算法生成的ID具备全局唯一性、递增性、高可用性和高性能性等特点。64位ID由符号位(固定为0)、41位时间戳、10位标识位(含数据中心与机器ID)及12位序列号组成。面对ID重复风险,可通过预分配、动态或统一分配标识位解决。Go语言实现示例展示了如何使用第三方包`sonyflake`生成ID,确保不同节点产生的ID始终唯一。
go语言后端开发学习(六) ——基于雪花算法生成用户ID
|
1月前
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-算法】连续学习算法之HNet:Continual learning with hypernetworks
本文提出了一种基于任务条件超网络(Hypernetworks)的持续学习模型,通过超网络生成目标网络权重并结合正则化技术减少灾难性遗忘,实现有效的任务顺序学习与长期记忆保持。
34 4
|
1月前
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-算法】连续学习算法之RWalk:Riemannian Walk for Incremental Learning Understanding
RWalk算法是一种增量学习框架,通过结合EWC++和修改版的Path Integral算法,并采用不同的采样策略存储先前任务的代表性子集,以量化和平衡遗忘和固执,实现在学习新任务的同时保留旧任务的知识。
74 3
|
1月前
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-综述】基于脑启发的连续学习算法有哪些?附思维导图
这篇博客文章总结了连续学习的分类,包括经典方法(重放、正则化和稀疏化方法)和脑启发方法(突触启发、双系统启发、睡眠启发和模块化启发方法),并讨论了它们在解决灾难性遗忘问题上的优势和局限性。
28 2

推荐镜像

更多