排序10万数据仅用2秒,Java帮你实现

简介: 排序10万数据仅用2秒,Java帮你实现

1.排序分类


排序(Sorting)是数据处理中一种很重要的运算,同时也是很常用的运算,
一般数据处理工作25%的时间都在进行排序。
简单地说,排序就是把一组记录(元素)按照
某个域的值的递增(即由小到大)或递减(即由大到小)的次序重新排列的过程。
1、内部排序法:指将需要处理的所有数据都加载到内部存储器中进行排序。
包括(交换式排序法、选择式排序法和插入式排序法);
2、外部排序法:数据量过大,无法全部加载到内存中,需要借助外部存储进行排序。
包括(合并排序法和直接合并排序法)。


2.内部排序法


2.1 交换式排序法


交换式排序属于内部排序法,是运用数据值比较后,
依判断规则对数据位置进行交换,以达到排序的目的。
交换式排序法又可分为两种:
1、冒泡排序法(Bubble Sorting)
2、快速排序法(Quick Sorting)


冒泡排序法案例


冒泡排序(Bubble Sorting)的基本思想是:
通过对待排序序列从后向前(从下标较大的元素开始),依次比较相邻元素的排序码,
若发现逆序则交换,
使排序码较小的元素逐渐从后部移向前部(从下标较大的单元移向下标较小的单元),
就象水底下的气泡一样逐渐向上冒。
因为排序的过程中,各元素不断接近自己的位置,
如果一趟比较下来没有进行过交换,就说明序列有序,
因此要在排序过程中设置一个标志flag判断元素是否进行过交换。
从而减少不必要的比较。


aab0fb82fe5941b681d73eabaf4d4ccf.png

//演示冒泡排序法
public class Demo {
  public static void main(String[] args) {
    int arr[]={1,6,0,-1,9,-100,90};
    int temp=0;
    //排序
    //外层循环,可以决定一共走趟
    for(int i=0;i<arr.length-1;i++){
      //内层循环,开始逐个比较,如果发现前一个数比后一个数大则交换
      for(int j=0;j<arr.length-1-i;j++){
        if(arr[j]>arr[j+1]){
          //换位
          temp=arr[j];
          arr[j]=arr[j+1];
          arr[j+1]=temp;
        }
      }
    }
    //输出最后结果
    for(int i=0;i<arr.length;i++){
      System.out.print(arr[i]+"\t");
    }
  }
}


2.2 选择式排序法


选择式排序也属于内部排序法,是从欲排序的数据中,
按指定的规则选出某一元素,经过和其他元素重整,
再依原则交换位置后达到排序的目的。
选择式排序又可分为两种:
1、选择排序法(Selection Sorting)
2、堆排序法(Heap Sorting)
选择排序(Select Sorting)也是一种简单的排序方法。
它的基本思想是:第一次从R[0]-R[n-1]中选取最小值,与R[0]交换,
第二次从R[1]-R[n-1]中选取最小值,与R[1]交换,
第三次从R[2]-R[n-1]中选取最小值,与R[2]交换,...,
第i次从R[i-1]-R[n-1]中选取最小值,与R[i-1]交换,...,
第n-1次从R[n-2]-R[n-1]中选取最小值,与R[n-2]交换,总共通过n-1次,
得到一个按排序码从小到大排列的有序序列。


选择排序法案例

e4130448591e43e492fa5e0a46e3fe9e.png

例如,给定n=8,数组R中的8个元素的排序码为:(8,3,2,1,7,4,6,5),选择排序过程。
//排序10万个数用时7秒
public class Demo{
  public static void main(String []args){
    int arr[]={8,3,2,1,7,4,6,5};
    int temp=0;
    for(int j=0;j<arr.length-1;j++){
      //认为第一个数就是最小数
      int min=arr[j];
      //记录最小数的下标
      int minIndex=j;
      for(int k=j+1;k<arr.length;k++){
        if(min>arr[k]){
          //修改最小值
          min=arr[k];
          minIndex=k;
        }
      }
      //当退出for循环时就找到这次的最小值
      temp=arr[j];
      arr[j]=arr[minIndex];
      arr[minIndex]=temp;
    }
    //输出最后结果
    for(int i=0;i<arr.length;i++){
      System.out.print(arr[i]+"\t");
    }
  }


2.3 插入式排序法


插入式排序属于内部排序法,
是对于欲排序的元素以插入的方式找寻该元素的适当位置,以达到排序的目的。
插入式排序法又可分为3种:
1、插入排序法(Insertion Sorting)
2、谢耳排序法(Shell Sorting)(欧洲人员喜欢使用)
3、二叉树排序法(Binary-tree Sorting)


插入排序案例


插入排序(Insertion Sorting)的基本思想是:
把n个待排序的元素看成为一个有序表和一个无序表,
开始有序表只包含一个元素,无序表中包含有n-1个元素,
排序过程中每次从无序表中取出第一个元素,
把它的排序码依次与有序表元素的排序码进行比较,
将它插入到有序表中的适当位置,使之成为新的有序表。


f3887fd9148042b39e1e2c9d86f002c0.png


//插入式排序法,排序10万数据用时2秒
public class Demo{
  public static void main(String []args){
  int arr[]={23,15,-13,62,5,-23,0,17};
    for(int i=1;i<arr.length;i++){
      int insertVal=arr[i];
      //insertVal准备和前一个数比较
      int index=i-1;
      while(index>=0&&insertVal<arr[index]){
        //将把arr[index]向后移动一位
        arr[index+1]=arr[index];
        //让index向前移动一位
        index--;
      }
      //将insertVal插入到适当位置
      arr[index+1]=insertVal;
    }
    //输出最后结果
    for(int i=0;i<arr.length;i++){
      System.out.print(arr[i]+"\t");
    } 
  }
}


3.外部排序法


3.1 合并排序法


 合并排序法(Merge Sorting)是外部排序最常使用的排序方法。
 若数据量太大无法一次完全加载内存,
 可使用外部辅助内存来处理排序数据,主要应用在文件排序。
排序方法:
   将欲排序的数据分别存在数个文件大小可加载内存的文件中,
   再针对各个文件分别使用“内部排序法”将文件中的数据排序好写回文件。
   再对所有已排序好的文件两两合并,直到所有文件合并成一个文件后,
   则数据排序完成。



92398af9334949b1bbb1b55eddb68d5f.png

//合并排序法
public class Demo{
    public static void main(String[] args) 
    {
        Merge m=new Merge();
        int a[]={5,4,10,8,7,9};
        m.merge_sort(a,0,a.length-1);
    }
}
class Merge{
//递归分成小部分
    public void merge_sort(int[] arrays,int start,int end){
        if(start<end){
            int m=(start+end)/2;
            merge_sort(arrays,start,m);
            merge_sort(arrays,m+1,end);
            combin_arrays(arrays,start,m,end);    
        }
    }
 //合并数组
    public void combin_arrays(int[] arrays,int start,int m,int end){
        int length=end-start+1;
        int temp[]=new int[length];//用来存放比较的数组,用完复制回到原来的数组
        int i=start;
        int j=m+1;
        int c=0;
        while(i<=m &&j<=end){
            if(arrays[i]<arrays[j]){
                temp[c]=arrays[i];
                i++;
                c++;
            }else{
                temp[c]=arrays[j];
                j++;
                c++;
            }
        }
        while(i<=m){
            temp[c]=arrays[i];
            i++;
        }
        while(j<=end){
        temp[c]=arrays[j];
        j++;
        }
        c=0;
        for(int t=start;t<=end;t++,c++){
            arrays[t]=temp[c];
        }
        snp(arrays);
    }
//打印数组
    public void snp(int[] arrays){
        for(int i=0;i<arrays.length;i++){
        System.out.print(arrays[i]+" ");
        }
        System.out.println();
    }
}
目录
相关文章
|
1月前
|
前端开发 JavaScript Java
java常用数据判空、比较和类型转换
本文介绍了Java开发中常见的数据处理技巧,包括数据判空、数据比较和类型转换。详细讲解了字符串、Integer、对象、List、Map、Set及数组的判空方法,推荐使用工具类如StringUtils、Objects等。同时,讨论了基本数据类型与引用数据类型的比较方法,以及自动类型转换和强制类型转换的规则。最后,提供了数值类型与字符串互相转换的具体示例。
|
10天前
|
Java 程序员
Java 排序神器:Comparable 和 Comparator 该怎么选?
嗨,大家好,我是小米!今天和大家聊一聊Java社招面试中常考的经典问题——Comparable和Comparator的区别。Comparable定义对象的自然排序,适用于单一固定的排序规则;Comparator则是策略接口,用于定义自定义排序规则,适用于多样化或多变的排序需求。掌握这两者的区别是理解Java排序机制的基础,也是面试中的加分题。结合实际项目场景深入探讨它们的应用,能更好地打动面试官。如果你觉得有帮助,欢迎点赞、收藏、分享,期待你的一键三连!我们下期见~ 我是小米,一个喜欢分享技术的程序员,关注我的微信公众号“软件求生”,获取更多技术干货!
40 20
|
3天前
|
存储 分布式计算 Hadoop
基于Java的Hadoop文件处理系统:高效分布式数据解析与存储
本文介绍了如何借鉴Hadoop的设计思想,使用Java实现其核心功能MapReduce,解决海量数据处理问题。通过类比图书馆管理系统,详细解释了Hadoop的两大组件:HDFS(分布式文件系统)和MapReduce(分布式计算模型)。具体实现了单词统计任务,并扩展支持CSV和JSON格式的数据解析。为了提升性能,引入了Combiner减少中间数据传输,以及自定义Partitioner解决数据倾斜问题。最后总结了Hadoop在大数据处理中的重要性,鼓励Java开发者学习Hadoop以拓展技术边界。
24 7
|
17天前
|
存储 Java BI
java怎么统计每个项目下的每个类别的数据
通过本文,我们详细介绍了如何在Java中统计每个项目下的每个类别的数据,包括数据模型设计、数据存储和统计方法。通过定义 `Category`和 `Project`类,并使用 `ProjectManager`类进行管理,可以轻松实现项目和类别的数据统计。希望本文能够帮助您理解和实现类似的统计需求。
68 17
|
2月前
|
JSON Java 程序员
Java|如何用一个统一结构接收成员名称不固定的数据
本文介绍了一种 Java 中如何用一个统一结构接收成员名称不固定的数据的方法。
39 3
|
2月前
|
Java 程序员 容器
Java中的变量和常量:数据的‘小盒子’和‘铁盒子’有啥不一样?
在Java中,变量是一个可以随时改变的数据容器,类似于一个可以反复打开的小盒子。定义变量时需指定数据类型和名称。例如:`int age = 25;` 表示定义一个整数类型的变量 `age`,初始值为25。 常量则是不可改变的数据容器,类似于一个锁死的铁盒子,定义时使用 `final` 关键字。例如:`final int MAX_SPEED = 120;` 表示定义一个名为 `MAX_SPEED` 的常量,值为120,且不能修改。 变量和常量的主要区别在于变量的数据可以随时修改,而常量的数据一旦确定就不能改变。常量主要用于防止意外修改、提高代码可读性和便于维护。
|
2月前
|
存储 缓存 安全
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见。本文介绍了使用 `File.createTempFile` 方法和自定义创建临时文件的两种方式,详细探讨了它们的使用场景和注意事项,包括数据缓存、文件上传下载和日志记录等。强调了清理临时文件、确保文件名唯一性和合理设置文件权限的重要性。
211 2
|
2月前
|
Java
Java 8 引入的 Streams 功能强大,提供了一种简洁高效的处理数据集合的方式
Java 8 引入的 Streams 功能强大,提供了一种简洁高效的处理数据集合的方式。本文介绍了 Streams 的基本概念和使用方法,包括创建 Streams、中间操作和终端操作,并通过多个案例详细解析了过滤、映射、归并、排序、分组和并行处理等操作,帮助读者更好地理解和掌握这一重要特性。
45 2
|
2月前
|
存储 分布式计算 Java
存算分离与计算向数据移动:深度解析与Java实现
【11月更文挑战第10天】随着大数据时代的到来,数据量的激增给传统的数据处理架构带来了巨大的挑战。传统的“存算一体”架构,即计算资源与存储资源紧密耦合,在处理海量数据时逐渐显露出其局限性。为了应对这些挑战,存算分离(Disaggregated Storage and Compute Architecture)和计算向数据移动(Compute Moves to Data)两种架构应运而生,成为大数据处理领域的热门技术。
87 2
|
2月前
|
SQL Java OLAP
java实现“数据平滑升级”
java实现“数据平滑升级”
50 2