【八大数据排序法】合并排序法的图形理解和案例实现 | C++

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 排序算法是我们在程序设计中经常见到和使用的一种算法,它主要是将一堆不规则的数据按照递增或递减的方式重新进行排序。在如今的互联网信息时代,随着大数据和人工智能的发展,大型企业的数据库中有亿级的用户数据量。因此对其进行处理,排序算法也就成为了其中必不可缺的步骤之一。

1b81d063ce22610f902263f57369b5ab_8f56327c5b4142688171b6caa8126163.png

前言

       排序算法是我们在程序设计中经常见到和使用的一种算法,它主要是将一堆不规则的数据按照递增或递减的方式重新进行排序。在如今的互联网信息时代,随着大数据和人工智能的发展,大型企业的数据库中有亿级的用户数据量。因此对其进行处理,排序算法也就成为了其中必不可缺的步骤之一。


认识排序

       排序功能对计算机领域而言,是一项非常重要而且普遍的工作。排序中数据的移动方式可分为直接移动和逻辑移动两种方式,直接移动是直接交换存储数据的位置,而逻辑移动并不会移动数据存储的位置,仅改变指向这些数据辅助指针的值。排序通常按照数据量的多少和所使用的内存,可分为内部排序和外部排序,数据量小可以全部加载到内存来进行排序的,就称为内部排序,大部分排序属于此类。数据量大而无法一次性加载到内存中,必须借助磁带,磁盘等辅助存储器进行排序的,则称为外部排序。随着数据结构科学的进步,如今,陆续被提出的冒泡排序法,选择排序法,插入排序法,合并排序法,快速排序法,堆积排序法,希尔排序法,基数排序法,直接合并排序法等等,它们各有其特色和其应用场合。并且在算法中,我们非常关注算法程序代码的时间复杂度和空间复杂度,因为它会直接体现出我们程序代码的执行效率以及编程人员的逻辑思维等等的综合能力。当数据量相当庞大时,排序算法所花费的时间就显得相当重要,排序算法的时间复杂度可分为最好情况、最坏情况以及平均情况。另外,对于任何的排序算法都会有数据交换的操作,数据互换位置会暂时用到一个额外的空间,这也是排序算法中空间复杂度要考虑到的问题,而在排序算法中所使用的额外空间越小,它的空间复杂度就越好。


一、合并排序法是什么?

1.简要介绍

       合并排序法是针对已经排序好的两个或两个以上的数列,通过合并的方式将其组合成一个大的且已经排好序的数列。即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列,该排序法也用到了分治法分而治之的思想。


2.具体情况

       合并排序法的具体步骤如下:


       (1)将N个长度为1的键值成对地合并为N/2个长度为2地键值组。


       (2)将N/2个长度为2地键值成对地合并为N/4个长度为4地键值组。


       (3)将键值组不断地去合并,直到合并成一组长度为N的键值组为止。


下面用合并排序法对40、10、42、75、51、99、66、24这十个数据元素进行从小到大的排序,具体情况如下图所示:

9cdd8eafd153a88ddcaefc0550fad912_383ed8a77a1b4117b75f12df951fd2f9.png


上面的图片中展示的是简单的一种合并排序法,其又被称为2-way合并排序(适用于偶数个数据)。我们可以将它的排序步骤进行整理:把初始时的8个长度为1的数列合并成4个已经排序完成且长度为2的数列;再将4个长度为2的数列合并成2个已经排序完成且长度为4的数列;最后将2个长度为4的数列合并成1个已经排序完成且长度为8的数列。


3.算法分析

       ①合并排序法的n个数据一般需要处理约次, 每次处理的时间复杂度为O(n)。所以该排序法的最好情况,最坏情况以及平均情况的时间复杂度为O()。


       ②合并排序法在排序过程中需要一个与数据文件大小同样的额外空间,所以空间复杂度O(n)。


       ③合并排序法是稳定排序法。


二、案例实现

1.案例一

①范例情况:用合并排序法,对在快速排序法下已经排序好的数列一16,25,39,27,30,42和数列二12,8,45,63,20,99这两组数据的12个数据进行从小到大的排序。


②代码展示:

#include<iostream>
using namespace std;
//事先声明排序数据的个数
#define size_1 6 
#define size_2 6
class sort{
public:
  int data_1[size_1];
  int data_2[size_2];
  int data_3[size_1 + size_2];
  void showresult(int len,int data[]) {
  for (int i = 0; i < len; i++)
    cout << data[i] << " ";
  cout <<  endl;
  }
};
class quick :public sort {
public:
  void quick_start(int left, int right,int data[]) {
  int left_idx, right_idx;
  int temp;
  if (left < right)
  {
    left_idx = left + 1;
    right_idx = right;
    while (1)
    {
    //从左向右扫描,找出一个键值大于data[left]的数据元素
    for (int i = left + 1; i <= right; i++)
    {
      if (data[i] > data[left])
      {
      left_idx = i;
      break;
      }
      left_idx++;
    }
    //从右向左扫描,找出一个键值小于data[left]的数据元素
    for (int j = right; j >= left + 1; j--)
    {
      if (data[j] < data[left])
      {
      right_idx = j;
      break;
      }
      right_idx--;
    }
    //如果left_idx<right_idx,将二者交换位置
    if (left_idx < right_idx) {
      temp = data[left_idx];
      data[left_idx] = data[right_idx];
      data[right_idx] = temp;
    }
    else {
      break;
    }
    }
    //如果left_idx>=right_idx
    if (left_idx >= right_idx)
    {
    //将data[left]与data[right_idx]交换位置
    temp = data[left];
    data[left] = data[right_idx];
    data[right_idx] = temp;
    //以递归的方式继续进行左半的快速排序
    quick_start(left, right_idx - 1,data);
    //以递归的方式继续进行右半的快速排序
    quick_start(right_idx + 1, right,data);
    }
  }
  }
};
class merge :public sort {
public:
  void merge_start(int data_1[],int data_2[],int data_3[]) {
  int i = 0, j = 0, k = 0;
  //进行数据的合并排序
  while (i<size_1&&j<size_2)
  {
    if (data_1[i] <= data_2[j])
    data_3[k++] = data_1[i++];
    else
    data_3[k++] = data_2[j++];
  }
  //再次检查判断,是否合并完成
  while (i < size_1)
    data_3[k++] = data_1[i++];
  while (j < size_2)
    data_3[k++] = data_2[j++];
  }
};
void text()
{
  sort s;
  quick q;
  merge g;
  cout << "请输入数列1中的" << size_1 << "个数据:";
  for (int i = 0; i < size_1; i++)
  cin >> s.data_1[i];
  cout << "请输入数列2中的" << size_2 << "个数据:";
  for (int i = 0; i < size_2; i++)
  cin >> s.data_2[i];
  //先利用最佳的快速排序法对两组数据进行分别排序
  q.quick_start(0,size_1-1,s.data_1);
  q.quick_start(0,size_2-1,s.data_2);
  cout << "排序后的数列1:"; s.showresult(size_1, s.data_1);
  cout << "排序后的数列2:"; s.showresult(size_2, s.data_2);
  //再利用合并排序法去将1,2两个数据列合并到数据列3中
  g.merge_start(s.data_1,s.data_2,s.data_3);
  cout << "合并后的数列:"; s.showresult(size_1 + size_2,s.data_3);
}
int main()
{
  text();
}

③代码展示:

ccae1d1531a7a34ffe4d2e8d7fcee8db_e3beea9d1cb14203af2b4319629cf73d.png


总结

       以上就是合并排序法的讲解,合并排序法其实更广泛的用于多个已经经过排序法排序好的数列,然后将多个数列进行合并的问题。我也在上面的案例实现中,刻意的去举了这样的一个案例,让大家去更好的去理解多个排序算法的综合应用,从而提高我们对算法的综合使用能力。


相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
1月前
|
C++
基本二叉树与排序二叉树(C++源码)
本程序实现二叉树基本操作与二叉排序树应用。支持前序建树、四种遍历、求深度、叶子数、第K层节点数及查找功能;并实现二叉排序树的构建、中序输出与查找比较次数统计,分析不同插入顺序对树形态和查找效率的影响。
|
6月前
|
存储 监控 算法
基于 C++ 哈希表算法实现局域网监控电脑屏幕的数据加速机制研究
企业网络安全与办公管理需求日益复杂的学术语境下,局域网监控电脑屏幕作为保障信息安全、规范员工操作的重要手段,已然成为网络安全领域的关键研究对象。其作用类似网络空间中的 “电子眼”,实时捕获每台电脑屏幕上的操作动态。然而,面对海量监控数据,实现高效数据存储与快速检索,已成为提升监控系统性能的核心挑战。本文聚焦于 C++ 语言中的哈希表算法,深入探究其如何成为局域网监控电脑屏幕数据处理的 “加速引擎”,并通过详尽的代码示例,展现其强大功能与应用价值。
153 2
|
7月前
|
存储 C++
UE5 C++:自定义Http节点获取Header数据
综上,通过为UE5创建一个自定义HTTP请求类并覆盖GetResult方法,就能成功地从HTTP响应的Header数据中提取信息。在项目中使用自定义类,不仅可以方便地访问响应头数据,也可随时使用这些信息。希望这种方法可以为你的开发过程带来便利和效益。
267 35
|
9月前
|
算法 Serverless 数据处理
从集思录可转债数据探秘:Python与C++实现的移动平均算法应用
本文探讨了如何利用移动平均算法分析集思录提供的可转债数据,帮助投资者把握价格趋势。通过Python和C++两种编程语言实现简单移动平均(SMA),展示了数据处理的具体方法。Python代码借助`pandas`库轻松计算5日SMA,而C++代码则通过高效的数据处理展示了SMA的计算过程。集思录平台提供了详尽且及时的可转债数据,助力投资者结合算法与社区讨论,做出更明智的投资决策。掌握这些工具和技术,有助于在复杂多变的金融市场中挖掘更多价值。
305 12
|
9月前
|
存储 监控 算法
公司监控上网软件架构:基于 C++ 链表算法的数据关联机制探讨
在数字化办公时代,公司监控上网软件成为企业管理网络资源和保障信息安全的关键工具。本文深入剖析C++中的链表数据结构及其在该软件中的应用。链表通过节点存储网络访问记录,具备高效插入、删除操作及节省内存的优势,助力企业实时追踪员工上网行为,提升运营效率并降低安全风险。示例代码展示了如何用C++实现链表记录上网行为,并模拟发送至服务器。链表为公司监控上网软件提供了灵活高效的数据管理方式,但实际开发还需考虑安全性、隐私保护等多方面因素。
178 0
公司监控上网软件架构:基于 C++ 链表算法的数据关联机制探讨
|
10月前
|
存储 人工智能 算法
【C++数据结构——内排序】二路归并排序(头歌实践教学平台习题)【合集】
本关任务是实现二路归并算法,即将两个有序数组合并为一个有序数组。主要内容包括: - **任务描述**:实现二路归并算法。 - **相关知识**: - 二路归并算法的基本概念。 - 算法步骤:通过比较两个有序数组的元素,依次将较小的元素放入新数组中。 - 代码示例(以 C++ 为例)。 - 时间复杂度为 O(m+n),空间复杂度为 O(m+n)。 - **测试说明**:平台会对你编写的代码进行测试,提供输入和输出示例。 - **通关代码**:提供了完整的 C++ 实现代码。 - **测试结果**:展示代码运行后的排序结果。 开始你的任务吧,祝你成功!
301 10
|
10月前
|
搜索推荐 算法 数据处理
【C++数据结构——内排序】希尔排序(头歌实践教学平台习题)【合集】
本文介绍了希尔排序算法的实现及相关知识。主要内容包括: - **任务描述**:实现希尔排序算法。 - **相关知识**: - 排序算法基础概念,如稳定性。 - 插入排序的基本思想和步骤。 - 间隔序列(增量序列)的概念及其在希尔排序中的应用。 - 算法的时间复杂度和空间复杂度分析。 - 代码实现技巧,如循环嵌套和索引计算。 - **测试说明**:提供了测试输入和输出示例,帮助验证代码正确性。 - **我的通关代码**:给出了完整的C++代码实现。 - **测试结果**:展示了代码运行的测试结果。 通过这些内容,读者可以全面了解希尔排序的原理和实现方法。
222 10
|
10月前
|
搜索推荐 C++
【C++数据结构——内排序】快速排序(头歌实践教学平台习题)【合集】
快速排序是一种高效的排序算法,基于分治策略。它的主要思想是通过选择一个基准元素(pivot),将数组划分成两部分。一部分的元素都小于等于基准元素,另一部分的元素都大于等于基准元素。然后对这两部分分别进行排序,最终使整个数组有序。(第一行是元素个数,第二行是待排序的原始关键字数据。本关任务:实现快速排序算法。开始你的任务吧,祝你成功!
255 7
|
10月前
|
存储 算法 搜索推荐
【C++面向对象——群体类和群体数据的组织】实现含排序功能的数组类(头歌实践教学平台习题)【合集】
1. **相关排序和查找算法的原理**:介绍直接插入排序、直接选择排序、冒泡排序和顺序查找的基本原理及其实现代码。 2. **C++ 类与成员函数的定义**:讲解如何定义`Array`类,包括类的声明和实现,以及成员函数的定义与调用。 3. **数组作为类的成员变量的处理**:探讨内存管理和正确访问数组元素的方法,确保在类中正确使用动态分配的数组。 4. **函数参数传递与返回值处理**:解释排序和查找函数的参数传递方式及返回值处理,确保函数功能正确实现。 通过掌握这些知识,可以顺利地将排序和查找算法封装到`Array`类中,并进行测试验证。编程要求是在右侧编辑器补充代码以实现三种排序算法
200 5
|
编译器 C++
【C++核心】指针和引用案例详解
这篇文章详细讲解了C++中指针和引用的概念、使用场景和操作技巧,包括指针的定义、指针与数组、指针与函数的关系,以及引用的基本使用、注意事项和作为函数参数和返回值的用法。
217 3