【Python数据结构与算法】—— 搜索算法 | 期末复习不挂科系列

简介: 【Python数据结构与算法】—— 搜索算法 | 期末复习不挂科系列



搜索

定义

搜索是指从元素集合中找到特定元素算法过程

搜索过程通常返回True 或 False 来表示元素是否在集合中。

有时也可以修改搜索过程,使它返回目标元素的位置。

为了更好的打好算法基础,我们这次先探索搜索的元素是否存在这一问题。


关键字-in

in是Python中的关键字,用于判断一个元素是否存在于一个容器中。可以用于列表、元组、字典、集合等数据类型。它可以被用于for循环语句 和 if语句中。

我们之前做Python每日一练时我曾科普过Python中 我们可以通过运算符 —— in 去检查元素是否在列表中。

print(15 in [1,2,3])
print(15 in [1,2,3,15])

运行结果:


顺序搜索

线性结构(数组、链表、栈、队列等)都有下标。每个数据项都有一个相对于其它数据项的位置。

Python的列表 ,数据项的位置就是其下标。

因为下标有序的,So 我们能够进行 顺序访问顺序搜索

无序表的顺序搜索过程

下图展示了顺序搜索的过程。

无序表的顺序搜索代码实现

def sequential_search(a_list,item):
    pos = 0
    while pos < len(a_list):
        if a_list[pos] == item:
            return  True
        pos += 1
    return  False
print(sequential_search([1,2,4,5,9],5))

从列表第一个元素开始, 沿着下表顺序逐个查看,直到找到目标元素或者到达列表末尾。

若查完列表后仍未找到目标元素,则说明目标元素不在列表中。

分析顺序搜索算法

分析搜索算法前,首先需要先定义 计算的基本单元---解决问题过程中不断重复的的某一步

对搜索来说,记录 比较的次数 是合理的 性能指标。

每次比较只有两个结果: 找到目标元素,或未找到。

假设元素排列无序,则目标元素在每一个位置出现的可能都相同。

确定目标元素是否在列表中,唯一的方法就是将它与列表中的每个元素都比较一次

列表中有n个元素,那么顺序搜索经过 n 次比较后才能确定目标元素不在列表中。如果列表含目标元素,分析起来更复杂。实际上有 3 种可能的情况:

最好情况目标元素位于列表的第一个位置,则只需比较一次;

最坏情况目标元素位于最后一个位置,则需要比较 n次

平均情况目标元素位于中间位置,则需要比较 n / 2次。 --> 当n增大,系数则可省略,所以顺序搜索时间复杂度O(n)


有序列表

有序列表的顺序搜索过程

通过观察上图有序列表列表中的顺序搜索过程我们可以得出以下结论:

元素按升序排列

如果存在目标元素,那么它出现在 n个位置中任意一个位置的可能性仍然一样大,因此比较次数与在无序列表相同

But,如果不存在目标元素,那么搜索效率就会提高。---> 因为当找到比目标元素大的数的时候程序就会停止搜索

无序表的顺序搜索代码实现

#有序表的顺序搜索
def ordered_sequential_search(a_list,item):
    pos = 0
    while pos < len(a_list):
        if a_list[pos] == item:
            return True
        elif a_list[pos] > item:
            return False
        pos += 1
    return False
print(ordered_sequential_search([1,2,4,5,9],6))

下表总结了,在有序表中搜索时的比较次数。

最好情况:只需比较1次。  平均情况比较 n / 2 次,但时间复杂度仍是O(n)。

总结:只有当列表不存在目标元素时,有序排列的元素,才能提高顺序搜索的效率

📝总结:

本篇文章介绍了搜索算法以及,有序列表在搜索算法中 的优势,前提条件是:只有当元素不在列表中时有序排列的元素,才能提高顺序搜索的效率

目录
相关文章
|
2天前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
2天前
|
算法 机器人 Python
Python实现教程:平面最短路径算法
Python实现教程:平面最短路径算法
10 1
|
8天前
|
机器学习/深度学习 Python
【Python 机器学习专栏】模型选择中的交叉验证与网格搜索
【4月更文挑战第30天】交叉验证和网格搜索是机器学习中优化模型的关键技术。交叉验证通过划分数据集进行多次评估,如K折和留一法,确保模型性能的稳定性。网格搜索遍历预定义参数组合,寻找最佳参数设置。两者结合能全面评估模型并避免过拟合。Python中可使用`sklearn`库实现这一过程,但需注意计算成本、过拟合风险及数据适应性。理解并熟练应用这些方法能提升模型性能和泛化能力。
|
8天前
|
机器学习/深度学习 运维 算法
【Python机器学习专栏】异常检测算法在Python中的实践
【4月更文挑战第30天】本文介绍了异常检测的重要性和在不同领域的应用,如欺诈检测和网络安全。文章概述了四种常见异常检测算法:基于统计、距离、密度和模型的方法。在Python实践中,使用scikit-learn库展示了如何实现这些算法,包括正态分布拟合、K-means聚类、局部异常因子(LOF)和孤立森林(Isolation Forest)。通过计算概率密度、距离、LOF值和数据点的平均路径长度来识别异常值。
|
8天前
|
机器学习/深度学习 数据可视化 算法
【Python机器学习专栏】t-SNE算法在数据可视化中的应用
【4月更文挑战第30天】t-SNE算法是用于高维数据可视化的非线性降维技术,通过最小化Kullback-Leibler散度在低维空间保持数据点间关系。其特点包括:高维到二维/三维映射、保留局部结构、无需预定义簇数量,但计算成本高。Python中可使用`scikit-learn`的`TSNE`类实现,结合`matplotlib`进行可视化。尽管计算昂贵,t-SNE在揭示复杂数据集结构上极具价值。
|
8天前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习专栏】关联规则学习:Apriori算法详解
【4月更文挑战第30天】Apriori算法是一种用于关联规则学习的经典算法,尤其适用于购物篮分析,以发现商品间的购买关联。该算法基于支持度和置信度指标,通过迭代生成频繁项集并提取满足阈值的规则。Python中可借助mlxtend库实现Apriori,例如处理购物篮数据,设置支持度和置信度阈值,找出相关规则。
|
8天前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习专栏】层次聚类算法的原理与应用
【4月更文挑战第30天】层次聚类是数据挖掘中的聚类技术,无需预设簇数量,能生成数据的层次结构。分为凝聚(自下而上)和分裂(自上而下)两类,常用凝聚层次聚类有最短/最长距离、群集平均和Ward方法。优点是自动确定簇数、提供层次结构,适合小到中型数据集;缺点是计算成本高、过程不可逆且对异常值敏感。在Python中可使用`scipy.cluster.hierarchy`进行实现。尽管有局限,层次聚类仍是各领域强大的分析工具。
|
8天前
|
机器学习/深度学习 算法 数据挖掘
【Python 机器学习专栏】K-means 聚类算法在 Python 中的实现
【4月更文挑战第30天】K-means 是一种常见的聚类算法,用于将数据集划分为 K 个簇。其基本流程包括初始化簇中心、分配数据点、更新簇中心并重复此过程直到收敛。在 Python 中实现 K-means 包括数据准备、定义距离函数、初始化、迭代和输出结果。虽然算法简单高效,但它需要预先设定 K 值,且对初始点选择敏感,可能陷入局部最优。广泛应用在市场分析、图像分割等场景。理解原理与实现对应用聚类分析至关重要。
|
8天前
|
机器学习/深度学习 算法 前端开发
【Python机器学习专栏】集成学习算法的原理与应用
【4月更文挑战第30天】集成学习通过组合多个基学习器提升预测准确性,广泛应用于分类、回归等问题。主要步骤包括生成基学习器、训练和结合预测结果。算法类型有Bagging(如随机森林)、Boosting(如AdaBoost)和Stacking。Python中可使用scikit-learn实现,如示例代码展示的随机森林分类。集成学习能降低模型方差,缓解过拟合,提高预测性能。
|
8天前
|
机器学习/深度学习 算法 Python
【Python 机器学习专栏】随机森林算法的性能与调优
【4月更文挑战第30天】随机森林是一种集成学习方法,通过构建多棵决策树并投票或平均预测结果,具有高准确性、抗过拟合、处理高维数据的能力。关键性能因素包括树的数量、深度、特征选择和样本大小。调优方法包括调整树的数量、深度,选择关键特征和参数优化。Python 示例展示了使用 GridSearchCV 进行调优。随机森林广泛应用于分类、回归和特征选择问题,是机器学习中的重要工具。