基础排序算法(Python版)

简介: 基础排序算法(Python版)

1.冒泡排序:

概念:冒泡排序的思想:依次比较相邻的两个记录的关键字,若两个记录是反序的(即前一个记录的关键字大于后前一个记录的关键字),则进行交换,直到没有反序的记录为止。假定数据放在一个列表lst中。


① 首先将lst[1]与lst[2]的关键字进行比较,若为反序(lst[1]的关键字大于lst[2]的关键字),则交换两个记录;然后比较lst[2]与lst[3]的关键字,依此类推,直到lst[n-1]与lst[n]的关键字比较后为止,称为一趟冒泡排序,lst[n]为关键字最大的记录。


② 然后进行第二趟冒泡排序,对前n-1个记录进行同样的操作。


一般地,第i趟冒泡排序是对lst[1 … n-i+1]中的记录进行的,因此,若待排序的记录有n个,则要经过n-1趟冒泡排序才能使所有的记录有序。


def bubble_sort(lst):
    length = len(lst)
    for i in range(length-1):  #共有length -1趟排序
        flag = True            #falg用于记录一趟冒泡排序中,是否有逆序发生
        for j in range(1,length-i):
            if lst[j-1]>lst[j]:
                flag = False   #有逆序发生
                lst[j-1],lst[j]=lst[j],lst[j-1]
        if flag == True:
            break
def main():
    list1 = [23, 38, 22, 45, 67, 31, 15, 41]
    print(list1)
    bubble_sort(list1)
    print(list1)
main()

运行结果:

image.png



2.选择排序

概念:每次从当前待排序的记录中选取关键字最小的记录表,然后与待排序的记录序列中的第一个记录进行交换,直到整个记录序列有序为止。


def select_sort(lst):
    n = len(lst)
    for i in range(0,n):
        min = i                             #最小元素下标标记
        for j in range(i+1,n):
            if lst[j] < lst[min]:
                min = j                     #找到最小值的下标
        lst[i],lst[min] = lst[min],lst[i]   #将找到的最小值与待排序的第一个记录交换
def main():
    list1 = [9, 6, -2, 21, 15, 8]
    select_sort(list1)
    print(list1)
main()  #调用main函数

运行结果:


image.png


3.插入排序

概念:将待排序的记录插入到已排好序的记录表中,得到一个新的、记录数增加1的有序表,选择下一个待排序的记录重复前面的操作,直到所有的记录都插入完为止。假设有n个元素需要排序,则需要n-1趟插入就可排好序。


def insertion_sort(lst):  
    lst_length=len(lst)  
    if lst_length<2:  
        return lst  
    for i in range(1,lst_length):  
        key=lst[i]  
        j=i-1  
        while j>=0 and key<lst[j]:  
            lst[j+1]=lst[j]  
            j=j-1  
        lst[j+1]=key  
    return lst
def main():
    list1 = [7, 4, 2, 19, 13, 6]
    print(list1)
    list2=insertion_sort(list1)
    print(list2)
main()

运行结果:

image.png


4.归并排序:

概念:①初始时,将每个记录看成一个单独的有序序列,则n个待排序记录就是n个长度为1的有序子序列;        ②对所有有序子序列进行两两归并,得到n/2个长度为2或1的有序子序列——一趟归并;         ③重复②,直到得到长度为n的有序序列为止。 上述排序过程中,子序列总是两两归并,称为2-路归并排序,其核心是将相邻的两个子序列归并成一个子序列。


def merge_sort(lst):  
    if len(lst)<2:  
        return lst  
    sorted_list=[]    #用于存放两个列表有序合并后的结果 
    left_list=merge_sort(lst[:len(lst)//2])  
    right_list=merge_sort(lst[len(lst)//2:])  
    while len(left_list)>0 and len(right_list)>0:  
        if left_list[0]<right_list[0]:  
            sorted_list.append(left_list.pop(0))  
        else:  
            sorted_list.append(right_list.pop(0))
    sorted_list += left_list
    sorted_list += right_list 
    return sorted_list  
def main():
    list1 = [23, 38, 22, 45, 24, 67, 31, 15, 41]
    print(list1)
    list2=merge_sort(list1)
    print(list2)
main()

运行结果:


image.png


5.快速排序

概念:快速排序是对冒泡排序的一种改进,它的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。


因快速排序较难,我们试着列出他的过程:


设待排序的数据序列放在列表lst中,可描述为lst[s…t],快速排序是在数据序列中任取一个数据(一般取lst[s])作为参照(又称为基准或枢轴),以lst[s]为基准重新排列其余的所有数据,方法是:


所有关键字比基准小的放lst[s]之前;


所有关键字比基准大的放lst[s]之后。


设置两个下标索引变量low,high,初值为列表的第1个和最后一个数据元素的位置。设两个变量i,j,初始时令i=low,j=high,以lst[low]作为基准,将lst[low]保存在变量k中。


(1)从j所指位置向前搜索:将lst[low]与lst[j]进行比较: ◆若lst[low] ≤ lst[j]:令j=j-1,然后继续进行比较,直到i=j或k > lst[j]为止; ◆若lst[low] > lst[j]:将lst [j]放进lst [i],腾空lst [j], 且令i=i+1; (2)从i位置起向后搜索:将k与lst[i]进行比较: ◆ 若k ≥ lst[i]:令i=i+1,然后继续进行比较,直到i=j或k < lst[i]为止; ◆ 若k < lst[i]:将lst [i]放进lst[j],腾空lst[i],且令j=j-1; (3)重复(1)、(2),直至i=j为止,i就是k(基准)所应放置的位置。


image.png


def quick_sort(lst, low, high):
    i = low 
    j = high
    if i >= j:     #递归终止的条件
        return lst
    k = lst[i]
    while i < j:
        while i < j and lst[j] >= k:
            j = j-1                                                             
        lst[i] = lst[j]   #将lst[j]放进lst[i],腾空lst[j]
        while i < j and lst[i] <= k:    
            i = i+1 
        lst[j] = lst[i]   #将lst[i]放进lst[j],腾空lst[i]
    lst[i] = k            #将基准k放入应放置的位置 
    quick_sort(lst, low, i-1)
    quick_sort(lst, i+1, high)
    return lst
def main():
    list1 = [55, 66, 22, 444, 24, 67, 31, 15, 41]
    print(list1)
    high = len(list1)-1
    list2=quick_sort(list1, 0, high)
    print(list2)
main()

运行结果:

image.png




相关文章
|
12天前
|
机器学习/深度学习 数据采集 算法
Python用逻辑回归、决策树、SVM、XGBoost 算法机器学习预测用户信贷行为数据分析报告
Python用逻辑回归、决策树、SVM、XGBoost 算法机器学习预测用户信贷行为数据分析报告
|
4天前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
4天前
|
算法 机器人 Python
Python实现教程:平面最短路径算法
Python实现教程:平面最短路径算法
12 1
|
10天前
|
机器学习/深度学习 运维 算法
【Python机器学习专栏】异常检测算法在Python中的实践
【4月更文挑战第30天】本文介绍了异常检测的重要性和在不同领域的应用,如欺诈检测和网络安全。文章概述了四种常见异常检测算法:基于统计、距离、密度和模型的方法。在Python实践中,使用scikit-learn库展示了如何实现这些算法,包括正态分布拟合、K-means聚类、局部异常因子(LOF)和孤立森林(Isolation Forest)。通过计算概率密度、距离、LOF值和数据点的平均路径长度来识别异常值。
|
10天前
|
机器学习/深度学习 数据可视化 算法
【Python机器学习专栏】t-SNE算法在数据可视化中的应用
【4月更文挑战第30天】t-SNE算法是用于高维数据可视化的非线性降维技术,通过最小化Kullback-Leibler散度在低维空间保持数据点间关系。其特点包括:高维到二维/三维映射、保留局部结构、无需预定义簇数量,但计算成本高。Python中可使用`scikit-learn`的`TSNE`类实现,结合`matplotlib`进行可视化。尽管计算昂贵,t-SNE在揭示复杂数据集结构上极具价值。
|
10天前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习专栏】关联规则学习:Apriori算法详解
【4月更文挑战第30天】Apriori算法是一种用于关联规则学习的经典算法,尤其适用于购物篮分析,以发现商品间的购买关联。该算法基于支持度和置信度指标,通过迭代生成频繁项集并提取满足阈值的规则。Python中可借助mlxtend库实现Apriori,例如处理购物篮数据,设置支持度和置信度阈值,找出相关规则。
|
10天前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习专栏】层次聚类算法的原理与应用
【4月更文挑战第30天】层次聚类是数据挖掘中的聚类技术,无需预设簇数量,能生成数据的层次结构。分为凝聚(自下而上)和分裂(自上而下)两类,常用凝聚层次聚类有最短/最长距离、群集平均和Ward方法。优点是自动确定簇数、提供层次结构,适合小到中型数据集;缺点是计算成本高、过程不可逆且对异常值敏感。在Python中可使用`scipy.cluster.hierarchy`进行实现。尽管有局限,层次聚类仍是各领域强大的分析工具。
|
10天前
|
机器学习/深度学习 算法 数据挖掘
【Python 机器学习专栏】K-means 聚类算法在 Python 中的实现
【4月更文挑战第30天】K-means 是一种常见的聚类算法,用于将数据集划分为 K 个簇。其基本流程包括初始化簇中心、分配数据点、更新簇中心并重复此过程直到收敛。在 Python 中实现 K-means 包括数据准备、定义距离函数、初始化、迭代和输出结果。虽然算法简单高效,但它需要预先设定 K 值,且对初始点选择敏感,可能陷入局部最优。广泛应用在市场分析、图像分割等场景。理解原理与实现对应用聚类分析至关重要。
|
10天前
|
机器学习/深度学习 算法 前端开发
【Python机器学习专栏】集成学习算法的原理与应用
【4月更文挑战第30天】集成学习通过组合多个基学习器提升预测准确性,广泛应用于分类、回归等问题。主要步骤包括生成基学习器、训练和结合预测结果。算法类型有Bagging(如随机森林)、Boosting(如AdaBoost)和Stacking。Python中可使用scikit-learn实现,如示例代码展示的随机森林分类。集成学习能降低模型方差,缓解过拟合,提高预测性能。
|
10天前
|
机器学习/深度学习 算法 Python
【Python 机器学习专栏】随机森林算法的性能与调优
【4月更文挑战第30天】随机森林是一种集成学习方法,通过构建多棵决策树并投票或平均预测结果,具有高准确性、抗过拟合、处理高维数据的能力。关键性能因素包括树的数量、深度、特征选择和样本大小。调优方法包括调整树的数量、深度,选择关键特征和参数优化。Python 示例展示了使用 GridSearchCV 进行调优。随机森林广泛应用于分类、回归和特征选择问题,是机器学习中的重要工具。