【数据结构】堆/堆排序(含top-k问题)(调整方式)(简洁,含代码)

简介: 【数据结构】堆/堆排序(含top-k问题)(调整方式)(简洁,含代码)

一.堆的逻辑结构与物理结构

堆满足两个条件:

1.堆中的某个节点的值总是不大于或不小于其父节点的值

2.堆总是一颗完全二叉树

image.png

 1.数组存储方式表示二叉树

数组存储表示二叉树只适合完全二叉树,以为会浪费很多空间

image.png

2.堆中的父子关系


image.png

3.大小堆的基本概念

大根堆:树中父亲结点都大于/等于孩子


小根堆:树种父亲结点都小于/等于孩子


二.堆的两种调整方式

PS:已有堆的基础上,对下标(parent,child)对应的元素进行调整


   1.向上调整(时间复杂度O(nlogn))

【参数:数组,孩子】

// 除了child这个位置,前面数据构成堆
void AdjustUp(HPDataType* a, int child)
{
  int parent = (child - 1) / 2;
  //while (parent >= 0)
  while(child > 0)
  {
    if (a[child] > a[parent])
    {
      Swap(&a[child], &a[parent]);
      child = parent;
      parent = (child - 1) / 2;
    }
    else
    {
      break;
    }
  }
}

 2.向下调整(时间复杂度O(n))

注意:向下调整有个条件,左右子树都必须是大堆/小堆

【为满足此条件:如要建堆,要从底部第一个父母结点开始调整,代码体现如下】

【参数:数组,界限,父母】

代码体现:

image.png

// 左右子树都是大堆/小堆
void AdjustDown(HPDataType* a, int n, int parent)
{
  int child = parent * 2 + 1;
  while (child < n)
  {
    // 选出左右孩子中大的那一个
    if (child + 1 < n && a[child+1] > a[child])
    {
      ++child;
    }
    if (a[child] > a[parent])
    {
      Swap(&a[child], &a[parent]);
      parent = child;
      child = parent * 2 + 1;
    }
    else
    {
      break;
    }
  }
}

三.建堆

1.向下调整建堆法

向下调整建堆必须要满足左右子树都是大/小堆。

故建堆要从倒数第一个父母结点开始往回遍历建堆。

void HeapSort(int* a, int n)
{
  // 建堆 -- 向下调整建堆
  for (int i = ((n-1)-1)/2; i < n; ++i) //((n-1)-1)/2是第一个父母结点
  {
    AdjustUp(a, i);
  }
  // 自己先实现
}

2.向上调整建堆

直接遍历。

void HeapSort(int* a, int n)
{
  // 建堆 -- 向上调整建堆
  for (int i = 1; i < n; ++i)
  {
    AdjustUp(a, i);
  }
  // 自己先实现
}

四.堆排序(利用堆删除的思想来进行排序)

image.png

1.排升序——建大堆

分析:

1.可以确保每次替换后,最大的数都会到数结尾。

2.可以确保每次替换后,再对除最末结点以外的树进行调整,剩下中最大的数会到祖先节点。

// 排升序 -- 建大堆 -- O(N*logN)
void HeapSort(int* a, int n)
{
  // 建堆 -- 向上调整建堆 -- O(N*logN)
  /*for (int i = 1; i < n; ++i)
  {
    AdjustUp(a, i);
  }*/
  // 建堆 -- 向下调整建堆 -- O(N)
  for (int i = (n - 1 - 1) / 2; i >= 0; --i)
  {
    AdjustDown(a, n, i);
  }
  // 自己先实现 -- O(N*logN)
  int end = n - 1;
  while (end > 0)
  {
    Swap(&a[end], &a[0]);
    AdjustDown(a, end, 0);
    --end;
  }
}

  2.排降序——建小堆

      (与上同理 )


3.堆排序复杂度分析

1.由数学计算:向上调整时间复杂度为O(nlogn),向下调整时间复杂度为O(n)


2.由二叉树数学关系,大致得出从祖先结点到最后一层排序的耗费大约为2^(h-1)*(h-1),


知其耗费的个数约为总数的一半。由时间复杂度可忽略有理数可得时间复杂度O(nlogn)


image.png

image.png

五.实际应用(top-k问题)


image.png

void CreateNDate()
{
  // 造数据
  int n = 10000000;
  srand(time(0));
  const char* file = "data.txt";
  FILE* fin = fopen(file, "w");
  if (fin == NULL)
  {
    perror("fopen error");
    return;
  }
  for (size_t i = 0; i < n; ++i)
  {
    int x = rand() % 10000;
    fprintf(fin, "%d\n", x);
  }
  fclose(fin);
}
void PrintTopK(const char* file, int k)
{
  // 1. 建堆--用a中前k个元素建小堆
  int* topk = (int*)malloc(sizeof(int) * k);
  assert(topk);
  FILE* fout = fopen(file, "r");
  if (fout == NULL)
  {
    perror("fopen error");
    return;
  }
  // 读出前k个数据建小堆
  for(int i = 0; i < k; ++i)
  {
    fscanf(fout, "%d", &topk[i]);
  }
  for (int i = (k-2)/2; i >= 0; --i)
  {
    AdjustDown(topk, k, i);
  }
  // 2. 将剩余n-k个元素依次与堆顶元素交换,不满则则替换
  int val = 0;
  int ret = fscanf(fout, "%d", &val);//自动跳到下一个
  while (ret != EOF)
  {
    if (val > topk[0])
    {
      topk[0] = val;
      AdjustDown(topk, k, 0);
    }
    ret = fscanf(fout, "%d", &val);
  }
  for (int i = 0; i < k; i++)
  {
    printf("%d ", topk[i]);
  }
  printf("\n");
  free(topk);
  fclose(fout);
}
相关文章
|
前端开发 Java
java实现队列数据结构代码详解
本文详细解析了Java中队列数据结构的实现,包括队列的基本概念、应用场景及代码实现。队列是一种遵循“先进先出”原则的线性结构,支持在队尾插入和队头删除操作。文章介绍了顺序队列与链式队列,并重点分析了循环队列的实现方式以解决溢出问题。通过具体代码示例(如`enqueue`入队和`dequeue`出队),展示了队列的操作逻辑,帮助读者深入理解其工作机制。
630 1
|
存储 搜索推荐 算法
【数据结构】树型结构详解 + 堆的实现(c语言)(附源码)
本文介绍了树和二叉树的基本概念及结构,重点讲解了堆这一重要的数据结构。堆是一种特殊的完全二叉树,常用于实现优先队列和高效的排序算法(如堆排序)。文章详细描述了堆的性质、存储方式及其实现方法,包括插入、删除和取堆顶数据等操作的具体实现。通过这些内容,读者可以全面了解堆的原理和应用。
823 16
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
635 1
|
存储 Java 开发者
Java中的Map接口提供了一种优雅的方式来管理数据结构,使代码更加清晰、高效
【10月更文挑战第19天】在软件开发中,随着项目复杂度的增加,数据结构的组织和管理变得至关重要。Java中的Map接口提供了一种优雅的方式来管理数据结构,使代码更加清晰、高效。本文通过在线购物平台的案例,展示了Map在商品管理、用户管理和订单管理中的具体应用,帮助开发者告别混乱,提升代码质量。
230 1
|
存储 算法 索引
HashMap底层数据结构及其增put删remove查get方法的代码实现原理
HashMap 是基于数组 + 链表 + 红黑树实现的高效键值对存储结构。默认初始容量为16,负载因子为0.75。当存储元素超过容量 * 负载因子时,会进行扩容。HashMap 使用哈希算法计算键的索引位置,通过链表或红黑树解决哈希冲突,确保高效存取。插入、获取和删除操作的时间复杂度接近 O(1)。
424 0
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
1256 10
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
413 59
|
存储 C语言 C++
【C++数据结构——栈与队列】顺序栈的基本运算(头歌实践教学平台习题)【合集】
本关任务:编写一个程序实现顺序栈的基本运算。开始你的任务吧,祝你成功!​ 相关知识 初始化栈 销毁栈 判断栈是否为空 进栈 出栈 取栈顶元素 1.初始化栈 概念:初始化栈是为栈的使用做准备,包括分配内存空间(如果是动态分配)和设置栈的初始状态。栈有顺序栈和链式栈两种常见形式。对于顺序栈,通常需要定义一个数组来存储栈元素,并设置一个变量来记录栈顶位置;对于链式栈,需要定义节点结构,包含数据域和指针域,同时初始化栈顶指针。 示例(顺序栈): 以下是一个简单的顺序栈初始化示例,假设用C语言实现,栈中存储
1018 77
|
11月前
|
编译器 C语言 C++
栈区的非法访问导致的死循环(x64)
这段内容主要分析了一段C语言代码在VS2022中形成死循环的原因,涉及栈区内存布局和数组越界问题。代码中`arr[15]`越界访问,修改了变量`i`的值,导致`for`循环条件始终为真,形成死循环。原因是VS2022栈区从低地址到高地址分配内存,`arr`数组与`i`相邻,`arr[15]`恰好覆盖`i`的地址。而在VS2019中,栈区先分配高地址再分配低地址,因此相同代码表现不同。这说明编译器对栈区内存分配顺序的实现差异会导致程序行为不一致,需避免数组越界以确保代码健壮性。
242 0
栈区的非法访问导致的死循环(x64)
|
11月前
232.用栈实现队列,225. 用队列实现栈
在232题中,通过两个栈(`stIn`和`stOut`)模拟队列的先入先出(FIFO)行为。`push`操作将元素压入`stIn`,`pop`和`peek`操作则通过将`stIn`的元素转移到`stOut`来实现队列的顺序访问。 225题则是利用单个队列(`que`)模拟栈的后入先出(LIFO)特性。通过多次调整队列头部元素的位置,确保弹出顺序符合栈的要求。`top`操作直接返回队列尾部元素,`empty`判断队列是否为空。 两题均仅使用基础数据结构操作,展示了栈与队列之间的转换逻辑。

热门文章

最新文章