【数据结构】向上调整建堆和向下调整建堆的天壤之别以及堆排序算法

简介: 【数据结构】向上调整建堆和向下调整建堆的天壤之别以及堆排序算法

向上调整


void AdjustUp(HPDataType* a, int child)
{
  int parent = (child - 1) / 2;
  while (child > 0)
  {
  if (a[child] > a[parent])
  { 
    Swap(&a[child], &a[parent]);
    child = parent;
    parent = (child - 1) / 2;
  }
  else
  {
    break;
  }
  }
}


向上调整建堆


for (int i = 1; i < n; i++)
  {
  AdjustUp(a, i);
  }


向下调整


void AdjustDown(HPDataType* a, int n, int parent)
{
  int child = parent * 2 + 1;
  while (child < n)
  {
  if (child+1< n && a[child + 1] > a[child])
  {
    child++;
  }
  if (a[child] > a[parent])
  {
    Swap(&a[child], &a[parent]);
    parent = child;
    child = parent * 2 + 1;
  }
  else
  {
    break;
  }
  }
}


向下调整建堆


for (int i = (n - 1 - 1) / 2; i >= 0; i--)
  {
  AdjustDown(a, n, i);
  }

两种方法的天壤之别


这两个建堆方法看似相同,实际却有着天壤之别。


具体的数值我们可以计算一下。


5b07bca2e537f08a8b624f29c0e9231d_a74c71e6b20a44deb928156e00f396c1.png


如图,二叉树的第h层有2^(h-1)个节点。


向下调整建堆最坏的情况就是每个节点都需要调整。


第一层有1个节点,最坏的情况是每个节点向下移动n-1层,次数就是1*(n-1)次。


第二层有2个节点,最坏的情况是每个节点向下移动n-2层,次数就是2*(n-2)次。


以此类推。。。


第n-2层有2^(n-3)个节点,最坏的情况是每个节点向下移动两层,次数就是2^(n-3)次.


第n-1层有2^(n-2)个节点,最坏的情况是每个节点向下移动一层,次数就是2^(n-2)次。


总共的计算次数就是f(h)=2^0*(n-1)+2^1*(n-2)+……+2^(h-3)*2+2*(n-2)*1次


这个数字我们可以用错位相减法计算出来。


最后得到的结果F(h)= 2^h -1 - h。


假设树的节点有N个。


那么根据公式,2 ^ h - 1= N。


把表达式往N上凑。


就得到F(N) = N - log(N+1)。


向下调整建堆的时间复杂度也就得出来了,log(N+1)的大小基本可忽略。


所以向下调整的时间复杂度是o(N)左右。


再来看向上调整建堆。


向上调整就没有这么优秀了。


c42256662d5bda9431a6d49cade49d72_247ce2bdfa4c454a8d49fda5bc1f5b9c.png


假设树的高度是h,二叉树的最后一层就占了一半的节点。


我们仍旧按最坏的情况来算。


最后一层的每个节点都需要向上调整h-1次,光最后一层调整的次数就已经有2^(h-1)*(h-1)次了。


光看这一层可以看出差距。


上一条讲的向下调整的特点是节点多的层级调整的次数少,是少乘多。


而现在讲的向上调整恰恰相反。


节点多的层级调整的次数多,是多乘多,这就造成了时间复杂度的巨大差异。


同样来计算一下。


假设高度为h。


F(h)=2^1*1+2^2*2+……+2^(h-2)*h-2+2^(h-1)*(h-1)


同样使用错位相减,解得F(h) = 2^h * (h-2) + 2


因为 N = 2^h-1。


我们将F(h)换成关于N的式子,F(N) = (N+1) * (log(N+1) -2 ) + 2 。  


同样是忽略掉不重要的数据,它的时间复杂度大概是O(N*logN)。它的量级比向下调整大了很多。


所以一般情况下,我们建堆一般是用向下调整。


总结一下


建堆——向下调整建堆——时间复杂度:O(N)


建堆——向上调整建堆——时间复杂度:O(N*logN)


时间复杂度上向下调整建堆优秀很多,我们建堆一般就使用它。


堆排序


void HeapSort(int* a, int n)
{
  //向下调整建堆
  for (int i = (n - 1 - 1) / 2; i >= 0; i--)
  {
  AdjustDown(a, n, i);
  }
//向下排序
  while (end>0)
  {
  Swap(&a[0], &a[end]);
  AdjustDown(a,end, 0);
  --end;
  }
}


将待排序序列构造成一个大堆

此时,整个序列的最大值就是堆顶的根节点。

将其与末尾元素进行交换,此时末尾就为最大值。

然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了。

可以看到在构建大顶堆的过程中,元素的个数逐渐减少,最后就得到一个有序序列了

向下排序和上面向上调整建堆很像,时间复杂度都可以认为是O(N*logN)。

ef4abeaed633d48e0c556e7a70e68ad0_0e9669fdbbf11039dcbdc2fb4390ab97.jpeg


相关文章
|
2月前
|
存储 算法 Java
散列表的数据结构以及对象在JVM堆中的存储过程
本文介绍了散列表的基本概念及其在JVM中的应用,详细讲解了散列表的结构、对象存储过程、Hashtable的扩容机制及与HashMap的区别。通过实例和图解,帮助读者理解散列表的工作原理和优化策略。
43 1
散列表的数据结构以及对象在JVM堆中的存储过程
|
2月前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
49 1
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
117 4
|
3月前
|
存储 人工智能 算法
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
这篇文章详细介绍了Dijkstra和Floyd算法,这两种算法分别用于解决单源和多源最短路径问题,并且提供了Java语言的实现代码。
99 3
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
|
11天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
49 20
|
2月前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
2月前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
2月前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
110 23
|
2月前
|
算法
数据结构之蜜蜂算法
蜜蜂算法是一种受蜜蜂觅食行为启发的优化算法,通过模拟蜜蜂的群体智能来解决优化问题。本文介绍了蜜蜂算法的基本原理、数据结构设计、核心代码实现及算法优缺点。算法通过迭代更新蜜蜂位置,逐步优化适应度,最终找到问题的最优解。代码实现了单链表结构,用于管理蜜蜂节点,并通过适应度计算、节点移动等操作实现算法的核心功能。蜜蜂算法具有全局寻优能力强、参数设置简单等优点,但也存在对初始化参数敏感、计算复杂度高等缺点。
62 20
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
65 1