在日常的业务开发中,偶尔会遇到需要将 List 集合中的重复数据去除掉的场景。
这个时候可能有同学会问:为什么不直接使用 Set 或者 LinkedHashSet 呢?这样不就没有重复数据的问题了嘛?
不得不说,能提这个问题的同学很机智,一眼就看到了问题的本质。
但是,在实际的业务开发中遇到的情况会更复杂。比如,List 集合可能是历史遗留问题,也有可能是调用接口返回的类型限制,只能使用 List 接收,又或者是代码写了一半,在做多个集合合并的时候才发现了这个问题,总之造成问题的原因有很多种,这里就不一一列举了。
当发现这个问题之后,如果可以通过改造原有代码,把原来的 List 类型替换成 Set 类型,那就可以直接修改集合的类型即可。但如果压根就修改不了,或者是修改的成本太大,那接下来这 6 种去重的方法,将帮你将解决问题。
前置知识
正式开始之前,先来搞懂两组概念:无序集合和有序集合 & 无序和有序。因为接下来的方法实现中,会反复提及这两组概念,所以有必要在正式开始之前,先把它们搞清楚。
无序集合
无序集合是指,数据读取的顺序和数据插入的顺序是不一致的。
例如,插入集合的顺序是:1、5、3、7,而集合的读取顺序竟然是:1、3、5、7。
有序集合
有序集合的概念和无序集合的概念正好相反,它是指集合的读取顺序和插入顺序是一致的。
例如,插入数据的顺序是:1、5、3、7,那么读取的顺序也是:1、5、3、7。
有序和无序
通过上面的无序集合和有序集合,我们可以得出有序和无序的概念。有序指的是数据的排列顺序和读取顺序符合我们的预期就叫做有序。而无序指的是数据的排列顺序和读取顺序不符合我们的预期就叫做无序。
PS:如果对于有序和无序的概念不是很清楚也没关系,通过下面的事例,我们可以进一步的理解它们的含义。
方法1:contains判断去重(有序)
要进行数据去重,我们首先想到的是新建一个集合,然后循环原来的集合,每次循环判断原集合中的循环项,如果当前循环的数据,没有在新集合中存在就插入,已经存在了就舍弃,这样当循环执行完,我们就得到了一个没有重复元素的集合了,实现代码如下:
public class ListDistinctExample { public static void main(String[] args) { List<Integer> list = new ArrayList<Integer>() {{ add(1); add(3); add(5); add(2); add(1); add(3); add(7); add(2); }}; System.out.println("原集合:" + list); method(list); } /** * 自定义去重 * @param list */ public static void method(List<Integer> list) { // 新集合 List<Integer> newList = new ArrayList<>(list.size()); list.forEach(i -> { if (!newList.contains(i)) { // 如果新集合中不存在则插入 newList.add(i); } }); System.out.println("去重集合:" + newList); } }
以上程序执行的结果,如下所示:
此方法的优点的:理解起来比较简单,并且最终得到的集合也是有序的,这里的有序指的是新集合的排列顺序和原集合的顺序是一致的;但缺点是实现代码有点多,不够简洁优雅。