【Python查找算法】二分查找、线性查找、哈希查找

简介: 【Python查找算法】二分查找、线性查找、哈希查找

1 二分查找算法

     二分查找(Binary Search)是一种用于在有序数据集合中查找特定元素的高效算法。它的工作原理基于将数据集合分成两半,然后逐步缩小搜索范围,直到找到目标元素或确定目标元素不存在。

以下是二分查找的工作原理的详细说明:

  1. 有序数据集合:首先,数据集合必须是有序的,通常是按升序或降序排列的。这一点非常重要,因为二分查找的核心思想是根据中间元素与目标元素的大小关系来确定搜索范围。
  2. 初始化指针:初始化两个指针,一个指向数据集合的第一个元素(左指针),另一个指向最后一个元素(右指针)。
  3. 确定中间元素:计算左指针和右指针的中间位置,即 (left + right) // 2。这将确定搜索区域的中间元素。
  4. 比较中间元素:将中间元素与目标元素进行比较:

          1.如果中间元素等于目标元素,搜索成功,返回中间元素的索引。

          2.如果中间元素大于目标元素,说明目标元素应该在左半部分,将右指针移到中间元素的左侧一位,即 right = mid - 1

          3.如果中间元素小于目标元素,说明目标元素应该在右半部分,将左指针移到中间元素的右侧一位,即 left = mid + 1

  1. 重复步骤3和4:在每次比较后,缩小搜索范围,继续比较直到找到目标元素或搜索范围为空(即左指针大于右指针)。
  2. 返回结果:如果找到目标元素,返回它的索引;如果搜索范围为空仍未找到目标元素,返回一个指示未找到的值(通常是 -1)。

以下是一个简单的示例,演示如何使用二分查找在有序数组中查找目标元素:

def binary_search(arr, target):
    left, right = 0, len(arr) - 1  # 初始化左右指针,分别指向数组的起始和结束位置
    while left <= right:  # 当左指针不大于右指针时,继续搜索
        mid = (left + right) // 2  # 计算中间位置
        if arr[mid] == target:  # 如果中间元素等于目标元素,搜索成功
            return mid  # 返回中间元素的索引
        elif arr[mid] < target:  # 如果中间元素小于目标元素,说明目标在右半部分
            left = mid + 1  # 移动左指针到中间元素的右侧一位
        else:  # 否则,目标在左半部分
            right = mid - 1  # 移动右指针到中间元素的左侧一位
    return -1  # 如果搜索范围为空仍未找到目标元素,返回 -1 表示未找到
# 示例用法
sorted_list = [1, 2, 3, 4, 7, 9]
target_element = 7
result = binary_search(sorted_list, target_element)
if result != -1:
    print(f"元素 {target_element} 在索引 {result} 处找到。")
else:
    print("元素未找到。")

上述代码演示了如何使用二分查找在有序列表 sorted_list 中查找目标元素 7。根据工作原理,二分查找的时间复杂度为 O(log n),其中 n 是数据集合的大小,这使得它非常适合在大型有序数据集合中查找目标元素。


2 线性查找算法

       线性查找(Linear Search)是一种简单的搜索算法,也称为顺序查找。它的工作原理是逐个遍历数据集合中的元素,直到找到匹配的元素或遍历整个集合。

原理:

  1. 从数据集合的第一个元素开始,逐个检查每个元素,直到找到匹配的元素或遍历整个集合。
  2. 如果找到与目标元素匹配的元素,返回该元素的索引(位置)。
  3. 如果遍历整个集合都没有找到匹配的元素,返回特定的“未找到”值(通常是 -1)。

以下是线性查找的原理示例:

数据集合: [2, 4, 7, 1, 9, 3]
要查找的元素: 7
初始状态:
[2, 4, 7, 1, 9, 3]
 ^
第一次比较:元素 2 与目标 7 不匹配,继续下一个元素。
[2, 4, 7, 1, 9, 3]
    ^
第二次比较:元素 4 与目标 7 不匹配,继续下一个元素。
[2, 4, 7, 1, 9, 3]
       ^
第三次比较:元素 7 与目标 7 匹配,找到了目标元素。
[2, 4, 7, 1, 9, 3]
          ^
目标元素 7 找到在索引 2 处。

       上述示意图演示了如何使用线性查找在给定的数据集合中查找目标元素 7。算法从数据集合的第一个元素开始逐个比较,直到找到匹配的元素或遍历整个集合。

       这个示意图反映了线性查找的工作原理,即逐个遍历数据元素以寻找匹配项。如果目标元素存在于数据集合中,线性查找将找到该元素的索引。如果目标元素不存在,则遍历整个数据集合后返回特定的未找到值(通常是 -1)。

以下是一个Python线性查找示例代码:

def linear_search(arr, target):
    """
    线性查找函数
    Parameters:
    - arr: 待查找的列表
    - target: 要查找的目标元素
    Returns:
    - 如果找到目标元素,返回其索引;否则返回 -1。
    """
    for i in range(len(arr)):  # 遍历列表中的每个元素
        if arr[i] == target:  # 如果当前元素与目标元素匹配
            return i  # 返回匹配元素的索引
    return -1  # 如果遍历完整个列表未找到匹配元素,返回 -1 表示未找到
# 示例用法
my_list = [2, 4, 7, 1, 9, 3]
target_element = 7
result = linear_search(my_list, target_element)  # 调用线性查找函数
if result != -1:
    print(f"元素 {target_element} 在索引 {result} 处找到。")
else:
    print("元素未找到。")

       在上述代码中,linear_search 函数用于执行线性查找。它接受两个参数:要查找的列表 arr 和目标元素 target。函数逐个遍历列表中的元素,如果找到匹配的元素,则返回匹配元素的索引;如果遍历完整个列表都没有找到匹配元素,则返回 -1 表示未找到。


3 哈希查找算法

       哈希查找(Hash Search)是一种高效的搜索算法,它利用哈希函数将键映射到存储位置,并在该位置查找目标元素。哈希查找适用于快速查找和检索,特别适用于大型数据集合。以下是哈希查找的详细解释和示例:

工作原理:

  1. 哈希表:哈希查找的核心是哈希表,它是一个数据结构,由键-值对组成。哈希表内部使用哈希函数将键转换为存储位置(索引),然后将键和值存储在该位置。
  2. 哈希函数:哈希函数接受一个键作为输入,并生成一个索引(位置),通常是一个整数。好的哈希函数应该具有以下特性:

          1.对于相同的输入键,始终生成相同的索引。

          2.将不同的输入键均匀地映射到不同的索引,以减少冲突。

          3.生成的索引应尽可能分散,以降低冲突的可能性。

  1. 查找过程:要查找目标元素,哈希函数首先计算目标元素的哈希值(索引),然后在哈希表的该位置查找对应的值。如果找到匹配的值,查找成功;否则,表示未找到目标元素。

示例代码:

以下是一个使用Python的哈希查找示例代码,我们将使用字典作为哈希表来演示:

# 创建一个哈希表(字典)
my_dict = {'apple': 3, 'banana': 2, 'cherry': 5, 'date': 1, 'grape': 4}
# 要查找的目标键
target_key = 'banana'
# 使用哈希查找
if target_key in my_dict:
    value = my_dict[target_key]
    print(f"The value of {target_key} is {value}")
else:
    print(f"{target_key} not found")

       在上述示例中,我们首先创建了一个哈希表 my_dict,其中包含键-值对。然后,我们定义了要查找的目标键 target_key 为 'banana'。通过使用哈希查找,我们可以直接访问哈希表中的值,而不需要逐个遍历整个集合。如果目标键存在于哈希表中,我们将获得与该键关联的值。

       请注意,哈希查找的效率非常高,因为它通常具有常量时间复杂度 O(1)。然而,哈希函数的设计和解决冲突的方法对算法的性能至关重要。合适的哈希函数和处理冲突的方法可以确保高效的哈希查找。


4 应用

线性查找(Linear Search):

  • 工作原理:逐个遍历数据集合,查找目标元素。
  • 应用:适用于小型无序数据集合,或当数据无序且不频繁查找时。常见于简单的列表或数组。

二分查找(Binary Search):

  • 工作原理:适用于有序数据集合,将数据集合分成两半,逐步缩小搜索范围。
  • 应用:适用于大型有序数据集合,如数组或有序列表。常见于数据库索引等高效查找场景。

哈希查找(Hash Search):

  • 工作原理:通过哈希函数将键映射到存储位置,查找时直接访问该位置。
  • 应用:适用于快速查找,如字典、散列表(哈希表)等数据结构。常用于处理大量数据的快速索引。

二叉搜索树查找(Binary Search Tree Search):

  • 工作原理:通过二叉搜索树的有序性,在左子树或右子树中查找目标元素。
  • 应用:适用于维护有序数据集合,如数据库索引、字典实现等
目录
相关文章
|
13天前
|
机器学习/深度学习 算法 TensorFlow
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
交通标志识别系统。本系统使用Python作为主要编程语言,在交通标志图像识别功能实现中,基于TensorFlow搭建卷积神经网络算法模型,通过对收集到的58种常见的交通标志图像作为数据集,进行迭代训练最后得到一个识别精度较高的模型文件,然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面,实现用户上传一张交通标志图片,识别其名称。
43 6
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
|
9天前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
22 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
4天前
|
机器学习/深度学习 算法 Java
[算法与数据结构] 谈谈线性查找法~
该文章详细介绍了线性查找法的基本概念与实现方法,通过Java代码示例解释了如何在一个数组中查找特定元素,并分析了该算法的时间复杂度。
|
6天前
|
大数据 UED 开发者
实战演练:利用Python的Trie树优化搜索算法,性能飙升不是梦!
在数据密集型应用中,高效搜索算法至关重要。Trie树(前缀树/字典树)通过优化字符串处理和搜索效率成为理想选择。本文通过Python实战演示Trie树构建与应用,显著提升搜索性能。Trie树利用公共前缀减少查询时间,支持快速插入、删除和搜索。以下为简单示例代码,展示如何构建及使用Trie树进行搜索与前缀匹配,适用于自动补全、拼写检查等场景,助力提升应用性能与用户体验。
20 2
|
9天前
|
算法 Python
震惊!Python 算法设计背后,时间复杂度与空间复杂度的惊天秘密大起底!
在 Python 算法设计中,理解并巧妙运用时间复杂度和空间复杂度的知识,是实现高效、优雅代码的必经之路。通过不断地实践和优化,我们能够在这两个因素之间找到最佳的平衡点,创造出性能卓越的程序。
26 4
|
10天前
|
算法 搜索推荐 开发者
别再让复杂度拖你后腿!Python 算法设计与分析实战,教你如何精准评估与优化!
在 Python 编程中,算法的性能至关重要。本文将带您深入了解算法复杂度的概念,包括时间复杂度和空间复杂度。通过具体的例子,如冒泡排序算法 (`O(n^2)` 时间复杂度,`O(1)` 空间复杂度),我们将展示如何评估算法的性能。同时,我们还会介绍如何优化算法,例如使用 Python 的内置函数 `max` 来提高查找最大值的效率,或利用哈希表将查找时间从 `O(n)` 降至 `O(1)`。此外,还将介绍使用 `timeit` 模块等工具来评估算法性能的方法。通过不断实践,您将能更高效地优化 Python 程序。
27 4
|
8天前
|
算法 程序员 Python
程序员必看!Python复杂度分析全攻略,让你的算法设计既快又省内存!
在编程领域,Python以简洁的语法和强大的库支持成为众多程序员的首选语言。然而,性能优化仍是挑战。本文将带你深入了解Python算法的复杂度分析,从时间与空间复杂度入手,分享四大最佳实践:选择合适算法、优化实现、利用Python特性减少空间消耗及定期评估调整,助你写出高效且节省内存的代码,轻松应对各种编程挑战。
20 1
|
9天前
|
算法 计算机视觉 Python
Python并查集大揭秘:让你在算法界呼风唤雨,秒杀一切复杂场景!
在编程与算法的广袤天地中,总有一些工具如同神兵利器,能够助你一臂之力,在复杂的问题前游刃有余。今天,我们就来深入探讨这样一件神器——Python并查集(Union-Find),看看它是如何让你在算法界呼风唤雨,轻松应对各种复杂场景的。
22 2
|
9天前
|
机器学习/深度学习 人工智能 算法
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台。果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜('土豆', '圣女果', '大白菜', '大葱', '梨', '胡萝卜', '芒果', '苹果', '西红柿', '韭菜', '香蕉', '黄瓜'),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,然后对数据集进行训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地文件方便后期调用。再使用Django框架搭建Web网页平台操作界面,实现用户上传一张果蔬图片识别其名称。
28 0
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
12天前
|
缓存 算法 数据处理
时间&空间复杂度,Python 算法的双重考验!如何优雅地平衡两者,打造极致性能?
在Python算法中,时间与空间复杂度的平衡至关重要。时间复杂度反映算法执行时间随输入规模的变化趋势,空间复杂度则关注额外存储空间的需求。优秀的算法需兼顾两者,如线性搜索时间复杂度为O(n),空间复杂度为O(1);二分查找在时间效率上显著提升至O(log n),空间复杂度保持为O(1);动态规划通过牺牲O(n)空间换取O(n)时间内的高效计算。实际应用中,需根据具体需求权衡,如实时数据处理重视时间效率,而嵌入式系统更关注空间节约。通过不断优化,我们能在Python中找到最佳平衡点,实现高性能程序。
34 3
下一篇
无影云桌面