C#数据结构与算法揭秘18

简介:

这节我们介绍堆排序。

、堆排序

在直接选择排序中,顺序表是一个线性结构,要从有n个记录的顺序表中选择出一个最小的记录需要比较n-1 次。如能把待排序的n个记录构成一个完全二叉树结构,则每次选择出一个最大(或最小)的记录比较的次数就是完全二叉树的高度, 即log2n次, 则排序算法的时间复杂度就是O (nlog2n) 。 这就是堆排序(Heap Sort)的基本思想。
堆分为最大堆和最小堆两种。最大堆的定义如下:
设顺序表sqList中存放了n个记录, 对于任意的i(0≤i≤n-1), 如果2i+1<n时有 sqList[i]的关键码不小于 sqList[2i+1]的关键码;如果 2i+2<n 时有sqList[i] 的关键码不小于 sqList[2i+2] 的关键码,则这样的堆为最大堆。 如果把这 n 个记录看作是一棵完全二叉树的结点,则 sqList[0]对应完全二叉树的根, sqList[1]对应树根的左孩子结点, sqList[2]对应树根的右孩子结点, sqList[3]对应 sqList[1]的左孩子结点,sqList[4]对应 sqList[2]的右孩子结点,如此等等。在此基础上,只需调整所有非叶子结点满足:sqList[i] 的关键码不小于 sqList[2i+1] 的关键码和 sqList[i] 的关键码不小于 sqList[2i+2]的关键码,则这样的完全二叉树就是一个最大堆。

如果把这 n 个记录看作是一棵完全二叉树的结点,则 sqList[0]对应完全二叉树的根, sqList[1]对应树根的左孩子结点, sqList[2]对应树根的右孩子结点, sqList[3]对应 sqList[1]的左孩子结点,sqList[4]对应 sqList[2]的右孩子结点,如此等等。在此基础上,只需调整所有非叶子结点满足:sqList[i] 的关键码不小于 sqList[2i+1] 的关键码和 sqList[i] 的关键码不小于 sqList[2i+2]
的关键码,则这样的完全二叉树就是一个最大堆。

下图1(a)所示是一棵完全二叉树,下图1(b)所示是一个最大堆。

类似地,最小堆的定义如下:
设顺序表sqList中存放了n个记录, 对于任意的i(0≤i≤n-1), 如果2i+1<n时有 sqList[i] 的关键码不大于 sqList[2i+1] 的关键码;如果 2i+2<n 时有sqList[i] 的关键码不大于 sqList[2i+2] 的关键码,则这样的堆为最小堆。 如果把这 n 个记录看作是一棵完全二叉树的结点,则 sqList[0]对应完全二叉树的根, sqList[1]对应树根的左孩子结点, sqList[2]对应树根的右孩子点,sqList[3]对应 sqList[1]的左孩子结点,sqList[4]对应 sqList[2]的右孩子结点,如此等等。在此基础上,只需调整所有非叶子结点满足:sqList[i] 的关键码不大于 sqList[2i+1] 的关键码和 sqList[i] 的关键码不大于 sqList[2i+2] 的关键码,则这样的完全二叉树就是一个最小堆。下图(a)所示是一棵完全二叉树,下图(b)所示是一个最小堆。

由堆的定义可知,堆有如下两个性质:
(1)最大堆的根结点是堆中关键码最大的结点,最小堆的根结点是堆中关键码最小的结点,我们称堆的根结点记录为堆顶记录。
(2)对于最大堆,从根结点到每个叶子结点的路径上,结点组成的序列都是递减有序的;对于最小堆,从根结点到每个叶子结点的路径上,结点组成的序列都是递增有序的。
堆排序的过程是:设有 n 个记录,首先将这 n 个记录按关键码建成堆,将堆顶记录输出,得到 n 个记录中关键码最大(或最小)的记录。然后,再把剩下的n-1 个记录,输出堆顶记录,得到 n 个记录中关键码次大(或次小)的记录。如此反复,便可得到一个按关键码有序的序列。 

因此,实现堆排序需解决两个问题:
(1)如何将 n 个记录的序列按关键码建成堆;
(2)输出堆顶记录后,怎样调整剩下的 n-1 个记录,使其按关键码成为一个新堆。
首先,以最大堆为例讨论第一个问题:如何将 n 个记录的序列按关键码建成堆。
根据前面的定义,顺序表 sqList 中的 n 个记录构成一棵完全二叉树,所有的叶子结点都满足最大堆的定义。 对于第 1 个非叶子结点 sqList[i] (i=(n-1)/2) ,由于其左孩子结点 sqList[2i+1]和右孩子结点 sqList[2i+2]都已是最大堆,所以,只需首先找出 sqList[2i+1]结点和 sqList[2i+2]结点中关键码的较大者,然后与 sqList[i]结点的关键码进行比较,如果 sqList[i]结点的关键码大于或等于这个较大的结点的关键码,则以 sqList[i]结点为根结点的完全二叉树已满足最大堆的定义;否则,对换 sqList[i]结点和关键码较大的结点,对换后以sqList[i]结点为根结点的完全二叉树满足最大堆的定义。按照这样的方法,再调整第 2 个非叶子结点 sqList[i-1] (i=(n-1)/2) ,第 3 个非叶子结点sqList[i-2],……,直到根结点。当根结点调整完后,则这棵完全二叉树就是一个最大堆了。
当要调整结点的左右孩子结点是叶子结点时,上述调整过程非常简单;当要调整结点的左右孩子结点不是叶子结点时,上述调整过程要稍微复杂一些。因为调整过后,可能引起以左孩子结点(或右孩子结点)为根结点的完全二叉树不是一个最大堆,这时,需要调整以左孩子结点(或右孩子结点)为根结点的完全二叉树,使之成为一个最大堆.

下图3

说明了如何把图1(a)所示的完全二叉树建成图1(b)所示的最大堆的过程。

第一步:从 i=(n-1)/2=(7-1)/2=3 开始,sqList[3]的关键码 27 小于sqList[7]的关键码 48, 所以, sqList[3]与 sqList[7]交换, 这样, 以 sqList[3]为根结点的完全二叉树是一个最大堆,如图(b)所示。

第二步:当 i=1 时,由于 sqList[1]的关键码 20 小于 sqList[3]的关键码48,所以将 sqList[1]与 sqList[3]交换,这样导致 sqList[3]的关键码 20 小于sqList[7]的关键码 27, 所以将 sqList[3]与 sqList[7]交换, 这样, 以 sqList[1]为根结点的完全二叉树是一个最大堆,如图(d)所示。

第三步:当 i=0 时,对堆顶结点记录进行调整,由于 sqList[0] 的关键码42小于sqList[1] 的关键码 48,所以将 sqList[0]与 sqList[1]交换,这样,
以 sqList[0]为根结点的完全二叉树是一个最大堆,如图(e)所示,整个堆建立的过程完成。

建堆的算法如下所示,算法中记录的比较表示记录关键码的比较,顺序表中只存放了记录的关键码。


//创建堆的算法
public void CreateHeap(SeqList<int> sqList, int low, int high) 
    { 
        //判断是不是    小于这个   最大值是否是小于  他的count
        if ((low < high) && (high <= sqList.Last)) 
        { 
           // 他的j的值
            int j = 0; 
            //交换的变量
            int tmp = 0;
            //默认k的计数 
            int k = 0; 
            for (int i = high / 2; i >= low; --i) 
            { 
                //取得的i值
                k = i; 
                //左子树
                j = 2 * k + 1; 
                //相应的变量
                tmp = sqList[i]; 
                while (j <= high) 
                { 
                    //寻找下一个值
                    if ((j < high) && (j + 1 <= high)  
&& (sqList[j] < sqList[j + 1])) 
                    { 
                        ++j; 
                    } 
                    //就想起商议5
                    if (tmp < sqList[j]) 
                    { 
                        sqList[k] = sqList[j]; 
                        k = j; 
                        j = 2 * k + 1; 
                    } 
                    else 
                    { 
                        j = high + 1; 
                    } 
                 } 
                sqList[k] = tmp; 
            } 
        } 
 }
//双层循环 算法的时间的复杂度是O(n2)

把顺序表中的记录建好堆后,就可以进行堆排序了。

堆排序的算法如下所示,算法中记录的比较表示记录关键码的比较,顺序表中只存放了记录的关键码:


 1 //进行堆排序
 2 public void HeapSort(SeqList<int> sqList) 
 3     { 
 4         //当前的变量
 5         int tmp = 0; 
 6  
 7          //创建相应的队
 8         CreateHeap(sqList, 0, sqList.Last); 
 9  
10         //进行循环遍历
11         for (int i = sqList.Last; i > 0; --i) 
12         {  
13            //进行相应交换的值
14             tmp = sqList[0]; 
15             sqList[0] = sqList[i]; 
16             sqList[i] = tmp; 
17            //创建相应的值
18             CreateHeap(sqList, 0, i-1); 
19         } 
20 }
21 //由于用到递归,所以时间的复杂度是O(nlog2n)

下图4是图3(d)所示的最大堆进行堆排序的过程。
第一步:将堆顶记录(关键码为 48)与顺序表最后一个记录(关键码为 20进行交换,使得堆顶记录的关键码 20 比根结点的左孩子结点的关键码 42 小,于是重新调整堆(记录的范围是从顺序表的第一个记录到倒数第二个记录,为了表示出顺序表的最后一个记录不在调整的范围之内,下图4(a)已经把最后一个结点从完全二叉树中去掉,以下同)。调整过程见下图4(b)所示。
第二步:将堆顶记录(关键码为 42)与顺序表倒数第二个记录(关键码为17*)进行交换,使得堆顶记录的关键码 17*比根结点的左孩子结点的关键码 22小,于是重新调整堆(记录的范围是从顺序表的第一个记录到倒数第三个记录) 。调整过程见下图4(c)所示。
第三步: 将堆顶记录 (关键码为 27) 与顺序表倒数第三个记录 (关键码为 8)进行交换,使得堆顶记录的关键码 8 比根结点的左孩子结点的关键码 20 小,于是重新调整堆(记录的范围是从顺序表的第一个记录到倒数第四个记录) 。调整过程见下图4(d)所示。
第四步:将堆顶记录(关键码为 20)与顺序表倒数第四个记录(关键码为13)进行交换,使得堆顶记录的关键码 13 比根结点的左孩子结点的关键码 17*小,于是重新调整堆(记录的范围是从顺序表的第一个记录到倒数第五个记录) 。调整过程见下图4(e)所示。

第五步:将堆顶记录(关键码为 17*)与顺序表倒数第五个记录(关键码为8)进行交换,使得堆顶记录的关键码比根结点的右孩子结点的关键码 17 值小,于是重新调整堆(记录的范围是从顺序表的第一个记录到倒数第六个记录) 。调整过程见图 下图4(f)所示。
第六步: 将堆顶记录 (关键码为 17) 与顺序表倒数第六个记录 (关键码为 8)进行交换,使得堆顶记录的关键码 8 比根结点的左孩子结点的关键码 13 小,于1是重新调整堆(记录的范围是从顺序表的第一个记录到倒数第七个记录) 。调整过程见图4(g)所示。

第七步:将堆顶记录(关键码为 13)与顺序表第二个记录(关键码为 13)进行交换,调整过程结束。调整过程见图4(h)所示

堆排序是一种较难的排序,思路是构建堆,在排序。 下节我继续介绍排序的内容。


目录
相关文章
|
6月前
|
存储 监控 算法
电脑监控管理中的 C# 哈希表进程资源索引算法
哈希表凭借O(1)查询效率、动态增删性能及低内存开销,适配电脑监控系统对进程资源数据的实时索引需求。通过定制哈希函数与链地址法冲突解决,实现高效进程状态追踪与异常预警。
302 10
|
10月前
|
存储 运维 监控
基于 C# 语言的 Dijkstra 算法在局域网内监控软件件中的优化与实现研究
本文针对局域网监控系统中传统Dijkstra算法的性能瓶颈,提出了一种基于优先队列和邻接表优化的改进方案。通过重构数据结构与计算流程,将时间复杂度从O(V²)降至O((V+E)logV),显著提升大规模网络环境下的计算效率与资源利用率。实验表明,优化后算法在包含1000节点、5000链路的网络中,计算时间缩短37.2%,内存占用减少21.5%。该算法适用于网络拓扑发现、异常流量检测、故障定位及负载均衡优化等场景,为智能化局域网监控提供了有效支持。
279 5
|
11月前
|
存储 算法 安全
如何控制上网行为——基于 C# 实现布隆过滤器算法的上网行为管控策略研究与实践解析
在数字化办公生态系统中,企业对员工网络行为的精细化管理已成为保障网络安全、提升组织效能的核心命题。如何在有效防范恶意网站访问、数据泄露风险的同时,避免过度管控对正常业务运作的负面影响,构成了企业网络安全领域的重要研究方向。在此背景下,数据结构与算法作为底层技术支撑,其重要性愈发凸显。本文将以布隆过滤器算法为研究对象,基于 C# 编程语言开展理论分析与工程实践,系统探讨该算法在企业上网行为管理中的应用范式。
312 8
|
11月前
|
存储 监控 算法
解析公司屏幕监控软件中 C# 字典算法的数据管理效能与优化策略
数字化办公的时代背景下,企业为维护信息安全并提升管理效能,公司屏幕监控软件的应用日益普及。此软件犹如企业网络的 “数字卫士”,持续记录员工电脑屏幕的操作动态。然而,伴随数据量的持续增长,如何高效管理这些监控数据成为关键议题。C# 中的字典(Dictionary)数据结构,以其独特的键值对存储模式和高效的操作性能,为公司屏幕监控软件的数据管理提供了有力支持。下文将深入探究其原理与应用。
317 4
|
机器学习/深度学习 监控 算法
员工上网行为监控软件中基于滑动窗口的C#流量统计算法解析​
在数字化办公环境中,员工上网行为监控软件需要高效处理海量网络请求数据,同时实时识别异常行为(如高频访问非工作网站)。传统的时间序列统计方法因计算复杂度过高,难以满足低延迟需求。本文将介绍一种基于滑动窗口的C#统计算法,通过动态时间窗口管理,实现高效的行为模式分析与流量计数。
342 2
|
人工智能 运维 算法
基于 C# 深度优先搜索算法的局域网集中管理软件技术剖析
现代化办公环境中,局域网集中管理软件是保障企业网络高效运行、实现资源合理分配以及强化信息安全管控的核心工具。此类软件需应对复杂的网络拓扑结构、海量的设备信息及多样化的用户操作,而数据结构与算法正是支撑其强大功能的基石。本文将深入剖析深度优先搜索(Depth-First Search,DFS)算法,并结合 C# 语言特性,详细阐述其在局域网集中管理软件中的应用与实现。
270 3
|
6月前
|
存储 机器学习/深度学习 监控
网络管理监控软件的 C# 区间树性能阈值查询算法
针对网络管理监控软件的高效区间查询需求,本文提出基于区间树的优化方案。传统线性遍历效率低,10万条数据查询超800ms,难以满足实时性要求。区间树以平衡二叉搜索树结构,结合节点最大值剪枝策略,将查询复杂度从O(N)降至O(logN+K),显著提升性能。通过C#实现,支持按指标类型分组建树、增量插入与多维度联合查询,在10万记录下查询耗时仅约2.8ms,内存占用降低35%。测试表明,该方案有效解决高负载场景下的响应延迟问题,助力管理员快速定位异常设备,提升运维效率与系统稳定性。
319 4
|
9月前
|
监控 算法 安全
基于 C# 基数树算法的网络屏幕监控敏感词检测技术研究
随着数字化办公和网络交互迅猛发展,网络屏幕监控成为信息安全的关键。基数树(Trie Tree)凭借高效的字符串处理能力,在敏感词检测中表现出色。结合C#语言,可构建高时效、高准确率的敏感词识别模块,提升网络安全防护能力。
239 2
|
10月前
|
监控 算法 数据处理
内网实时监控中的 C# 算法探索:环形缓冲区在实时数据处理中的关键作用
本文探讨了环形缓冲区在内网实时监控中的应用,结合C#实现方案,分析其原理与优势。作为固定长度的循环队列,环形缓冲区通过FIFO机制高效处理高速数据流,具备O(1)时间复杂度的读写操作,降低延迟与内存开销。文章从设计逻辑、代码示例到实际适配效果展开讨论,并展望其与AI结合的潜力,为开发者提供参考。
417 2
|
10月前
|
监控 算法 安全
公司电脑监控软件关键技术探析:C# 环形缓冲区算法的理论与实践
环形缓冲区(Ring Buffer)是企业信息安全管理中电脑监控系统设计的核心数据结构,适用于高并发、高速率与短时有效的多源异构数据处理场景。其通过固定大小的连续内存空间实现闭环存储,具备内存优化、操作高效、数据时效管理和并发支持等优势。文章以C#语言为例,展示了线程安全的环形缓冲区实现,并结合URL访问记录监控应用场景,分析了其在流量削峰、关键数据保护和高性能处理中的适配性。该结构在日志捕获和事件缓冲中表现出色,对提升监控系统效能具有重要价值。
305 1