排序10万数据仅用2秒,Java帮你实现

简介: 排序10万数据仅用2秒,Java帮你实现

1.排序分类


排序(Sorting)是数据处理中一种很重要的运算,同时也是很常用的运算,
一般数据处理工作25%的时间都在进行排序。
简单地说,排序就是把一组记录(元素)按照
某个域的值的递增(即由小到大)或递减(即由大到小)的次序重新排列的过程。
1、内部排序法:指将需要处理的所有数据都加载到内部存储器中进行排序。
包括(交换式排序法、选择式排序法和插入式排序法);
2、外部排序法:数据量过大,无法全部加载到内存中,需要借助外部存储进行排序。
包括(合并排序法和直接合并排序法)。


2.内部排序法


2.1 交换式排序法


交换式排序属于内部排序法,是运用数据值比较后,
依判断规则对数据位置进行交换,以达到排序的目的。
交换式排序法又可分为两种:
1、冒泡排序法(Bubble Sorting)
2、快速排序法(Quick Sorting)


冒泡排序法案例


冒泡排序(Bubble Sorting)的基本思想是:
通过对待排序序列从后向前(从下标较大的元素开始),依次比较相邻元素的排序码,
若发现逆序则交换,
使排序码较小的元素逐渐从后部移向前部(从下标较大的单元移向下标较小的单元),
就象水底下的气泡一样逐渐向上冒。
因为排序的过程中,各元素不断接近自己的位置,
如果一趟比较下来没有进行过交换,就说明序列有序,
因此要在排序过程中设置一个标志flag判断元素是否进行过交换。
从而减少不必要的比较。


aab0fb82fe5941b681d73eabaf4d4ccf.png

//演示冒泡排序法
public class Demo {
  public static void main(String[] args) {
    int arr[]={1,6,0,-1,9,-100,90};
    int temp=0;
    //排序
    //外层循环,可以决定一共走趟
    for(int i=0;i<arr.length-1;i++){
      //内层循环,开始逐个比较,如果发现前一个数比后一个数大则交换
      for(int j=0;j<arr.length-1-i;j++){
        if(arr[j]>arr[j+1]){
          //换位
          temp=arr[j];
          arr[j]=arr[j+1];
          arr[j+1]=temp;
        }
      }
    }
    //输出最后结果
    for(int i=0;i<arr.length;i++){
      System.out.print(arr[i]+"\t");
    }
  }
}


2.2 选择式排序法


选择式排序也属于内部排序法,是从欲排序的数据中,
按指定的规则选出某一元素,经过和其他元素重整,
再依原则交换位置后达到排序的目的。
选择式排序又可分为两种:
1、选择排序法(Selection Sorting)
2、堆排序法(Heap Sorting)
选择排序(Select Sorting)也是一种简单的排序方法。
它的基本思想是:第一次从R[0]-R[n-1]中选取最小值,与R[0]交换,
第二次从R[1]-R[n-1]中选取最小值,与R[1]交换,
第三次从R[2]-R[n-1]中选取最小值,与R[2]交换,...,
第i次从R[i-1]-R[n-1]中选取最小值,与R[i-1]交换,...,
第n-1次从R[n-2]-R[n-1]中选取最小值,与R[n-2]交换,总共通过n-1次,
得到一个按排序码从小到大排列的有序序列。


选择排序法案例

e4130448591e43e492fa5e0a46e3fe9e.png

例如,给定n=8,数组R中的8个元素的排序码为:(8,3,2,1,7,4,6,5),选择排序过程。
//排序10万个数用时7秒
public class Demo{
  public static void main(String []args){
    int arr[]={8,3,2,1,7,4,6,5};
    int temp=0;
    for(int j=0;j<arr.length-1;j++){
      //认为第一个数就是最小数
      int min=arr[j];
      //记录最小数的下标
      int minIndex=j;
      for(int k=j+1;k<arr.length;k++){
        if(min>arr[k]){
          //修改最小值
          min=arr[k];
          minIndex=k;
        }
      }
      //当退出for循环时就找到这次的最小值
      temp=arr[j];
      arr[j]=arr[minIndex];
      arr[minIndex]=temp;
    }
    //输出最后结果
    for(int i=0;i<arr.length;i++){
      System.out.print(arr[i]+"\t");
    }
  }


2.3 插入式排序法


插入式排序属于内部排序法,
是对于欲排序的元素以插入的方式找寻该元素的适当位置,以达到排序的目的。
插入式排序法又可分为3种:
1、插入排序法(Insertion Sorting)
2、谢耳排序法(Shell Sorting)(欧洲人员喜欢使用)
3、二叉树排序法(Binary-tree Sorting)


插入排序案例


插入排序(Insertion Sorting)的基本思想是:
把n个待排序的元素看成为一个有序表和一个无序表,
开始有序表只包含一个元素,无序表中包含有n-1个元素,
排序过程中每次从无序表中取出第一个元素,
把它的排序码依次与有序表元素的排序码进行比较,
将它插入到有序表中的适当位置,使之成为新的有序表。


f3887fd9148042b39e1e2c9d86f002c0.png


//插入式排序法,排序10万数据用时2秒
public class Demo{
  public static void main(String []args){
  int arr[]={23,15,-13,62,5,-23,0,17};
    for(int i=1;i<arr.length;i++){
      int insertVal=arr[i];
      //insertVal准备和前一个数比较
      int index=i-1;
      while(index>=0&&insertVal<arr[index]){
        //将把arr[index]向后移动一位
        arr[index+1]=arr[index];
        //让index向前移动一位
        index--;
      }
      //将insertVal插入到适当位置
      arr[index+1]=insertVal;
    }
    //输出最后结果
    for(int i=0;i<arr.length;i++){
      System.out.print(arr[i]+"\t");
    } 
  }
}


3.外部排序法


3.1 合并排序法


 合并排序法(Merge Sorting)是外部排序最常使用的排序方法。
 若数据量太大无法一次完全加载内存,
 可使用外部辅助内存来处理排序数据,主要应用在文件排序。
排序方法:
   将欲排序的数据分别存在数个文件大小可加载内存的文件中,
   再针对各个文件分别使用“内部排序法”将文件中的数据排序好写回文件。
   再对所有已排序好的文件两两合并,直到所有文件合并成一个文件后,
   则数据排序完成。



92398af9334949b1bbb1b55eddb68d5f.png

//合并排序法
public class Demo{
    public static void main(String[] args) 
    {
        Merge m=new Merge();
        int a[]={5,4,10,8,7,9};
        m.merge_sort(a,0,a.length-1);
    }
}
class Merge{
//递归分成小部分
    public void merge_sort(int[] arrays,int start,int end){
        if(start<end){
            int m=(start+end)/2;
            merge_sort(arrays,start,m);
            merge_sort(arrays,m+1,end);
            combin_arrays(arrays,start,m,end);    
        }
    }
 //合并数组
    public void combin_arrays(int[] arrays,int start,int m,int end){
        int length=end-start+1;
        int temp[]=new int[length];//用来存放比较的数组,用完复制回到原来的数组
        int i=start;
        int j=m+1;
        int c=0;
        while(i<=m &&j<=end){
            if(arrays[i]<arrays[j]){
                temp[c]=arrays[i];
                i++;
                c++;
            }else{
                temp[c]=arrays[j];
                j++;
                c++;
            }
        }
        while(i<=m){
            temp[c]=arrays[i];
            i++;
        }
        while(j<=end){
        temp[c]=arrays[j];
        j++;
        }
        c=0;
        for(int t=start;t<=end;t++,c++){
            arrays[t]=temp[c];
        }
        snp(arrays);
    }
//打印数组
    public void snp(int[] arrays){
        for(int i=0;i<arrays.length;i++){
        System.out.print(arrays[i]+" ");
        }
        System.out.println();
    }
}
目录
相关文章
|
7天前
|
Java 程序员 容器
Java中的变量和常量:数据的‘小盒子’和‘铁盒子’有啥不一样?
在Java中,变量是一个可以随时改变的数据容器,类似于一个可以反复打开的小盒子。定义变量时需指定数据类型和名称。例如:`int age = 25;` 表示定义一个整数类型的变量 `age`,初始值为25。 常量则是不可改变的数据容器,类似于一个锁死的铁盒子,定义时使用 `final` 关键字。例如:`final int MAX_SPEED = 120;` 表示定义一个名为 `MAX_SPEED` 的常量,值为120,且不能修改。 变量和常量的主要区别在于变量的数据可以随时修改,而常量的数据一旦确定就不能改变。常量主要用于防止意外修改、提高代码可读性和便于维护。
|
27天前
|
算法 Java 数据处理
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。HashSet基于哈希表实现,提供高效的元素操作;TreeSet则通过红黑树实现元素的自然排序,适合需要有序访问的场景。本文通过示例代码详细介绍了两者的特性和应用场景。
37 6
|
26天前
|
存储 Java API
深入剖析Java Map:不只是存储数据,更是设计艺术的体现!
【10月更文挑战第17天】在Java编程中,Map是一种重要的数据结构,用于存储键值对,并展现了设计艺术的精髓。本文深入剖析了Map的设计原理和使用技巧,包括基本概念、设计艺术(如哈希表与红黑树的空间时间权衡)、以及使用技巧(如选择合适的实现类、避免空指针异常等),帮助读者更好地理解和应用Map。
80 3
|
7天前
|
存储 缓存 安全
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见。本文介绍了使用 `File.createTempFile` 方法和自定义创建临时文件的两种方式,详细探讨了它们的使用场景和注意事项,包括数据缓存、文件上传下载和日志记录等。强调了清理临时文件、确保文件名唯一性和合理设置文件权限的重要性。
20 2
|
7天前
|
Java
Java 8 引入的 Streams 功能强大,提供了一种简洁高效的处理数据集合的方式
Java 8 引入的 Streams 功能强大,提供了一种简洁高效的处理数据集合的方式。本文介绍了 Streams 的基本概念和使用方法,包括创建 Streams、中间操作和终端操作,并通过多个案例详细解析了过滤、映射、归并、排序、分组和并行处理等操作,帮助读者更好地理解和掌握这一重要特性。
15 2
|
12天前
|
存储 分布式计算 Java
存算分离与计算向数据移动:深度解析与Java实现
【11月更文挑战第10天】随着大数据时代的到来,数据量的激增给传统的数据处理架构带来了巨大的挑战。传统的“存算一体”架构,即计算资源与存储资源紧密耦合,在处理海量数据时逐渐显露出其局限性。为了应对这些挑战,存算分离(Disaggregated Storage and Compute Architecture)和计算向数据移动(Compute Moves to Data)两种架构应运而生,成为大数据处理领域的热门技术。
33 2
|
18天前
|
SQL Java OLAP
java实现“数据平滑升级”
java实现“数据平滑升级”
35 2
|
22天前
|
SQL Java 关系型数据库
java连接mysql查询数据(基础版,无框架)
【10月更文挑战第12天】该示例展示了如何使用Java通过JDBC连接MySQL数据库并查询数据。首先在项目中引入`mysql-connector-java`依赖,然后通过`JdbcUtil`类中的`main`方法实现数据库连接、执行SQL查询及结果处理,最后关闭相关资源。
|
27天前
|
Java
Java Set以其“不重复”的特性,为我们提供了一个高效、简洁的处理唯一性约束数据的方式。
【10月更文挑战第16天】在Java编程中,Set接口确保集合中没有重复元素,每个元素都是独一无二的。HashSet基于哈希表实现,提供高效的添加、删除和查找操作;TreeSet则基于红黑树实现,不仅去重还能自动排序。通过这两个实现类,我们可以轻松处理需要唯一性约束的数据,提升代码质量和效率。
35 2
|
19天前
|
SQL Java OLAP
java实现“数据平滑升级”
java实现“数据平滑升级”
10 0