阿里开发手册 嵩山版-编程规约 (六)集合处理

简介: 《阿里开发手册 嵩山版》Java编程中的集合处理规范和最佳实践,旨在提升代码质量和开发效率。

历史版本

前言

《Java 开发手册》是阿里巴巴集团技术团队的集体智慧结晶和经验总结,经历了多次大规模一线实战的检验及不断完善,公开到业界后,众多社区开发者踊跃参与,共同打磨完善,系统化地整理成册,当前的版本是嵩山版。现代软件行业的高速发展对开发者的综合素质要求越来越高,因为不仅是编程知识点,其它维度的知识点也会影响到软件的最终交付质量。比如:五花八门的错误码人为地增加排查问题的难度;数据库的表结构和索引设计缺陷带来的系统架构缺陷或性能风险;工程结构混乱导致后续项目维护艰难;没有鉴权的漏洞代码易被黑客攻击等等。所以本手册以 Java 开发者为中心视角,划分为编程规约、异常日志、单元测试、安全规约、MySQL 数据库、工程结构、设计规约七个维度,再根据内容特征,细分成若干二级子目录。

另外,依据约束力强弱及故障敏感性,规约依次分为 【强制】【推荐】【参考】 三大类。在延伸信息中,“说明”对规约做了适当扩展和解释;“正例” 提倡什么样的编码和实现方式;“反例” 说明需要提防的雷区,以及真实的错误案例。

手册的愿景是码出高效,码出质量。现代软件架构的复杂性需要协同开发完成,如何高效地协 同呢?无规矩不成方圆,无规范难以协同,比如,制订交通法规表面上是要限制行车权,实际上是保障公众的人身安全,试想如果没有限速,没有红绿灯,谁还敢上路行驶?对软件来说,适当的规范和标准绝不是消灭代码内容的创造性、优雅性,而是限制过度个性化,以一种普遍认可的统一方式一起做事,提升协作效率,降低沟通成本。代码的字里行间流淌的是软件系统的血液,质量的提升是尽可能少踩坑,杜绝踩重复的坑,切实提升系统稳定性,码出质量。

我们已经在 2017 杭州云栖大会上发布了配套的 Java 开发规约 IDE 插件,下载量达到 162 万人次,阿里云效也集成了代码规约扫描引擎。次年,发布 36 万字的配套详解图书《码出高效》,本书秉持“图胜于表,表胜于言”的理念,深入浅出地将计算机基础、面向对象思想、JVM 探源、数据结构与集合、并发与多线程、单元测试等知识客观、立体地呈现出来。紧扣学以致用、学以精进的目标,结合阿里巴巴实践经验和故障案例,与底层源码解析融会贯通,娓娓道来。《码出高效》和《Java开发手册》稿费所得收入均捐赠公益事情,希望用技术情怀帮助更多的人。

一、编程规约

(六) 集合处理

1.【强制】关于 hashCode 和 equals 的处理,遵循如下规则:

1) 只要覆写 equals,就必须覆写 hashCode。

2) 因为Set 存储的是不重复的对象,依据 hashCode 和 equals 进行判断,所以 Set 存储的对象必须覆写这两种方法。

3)如果自定义对象作为 Map 的键,那么必须覆写 hashCode 和 equals。

说明:String 因为覆写了 hashCode 和 equals 方法,所以可以愉快地将 String 对象作为 key 来使用

2.【强制】判断所有集合内部的元素是否为空,使用 isEmpty()方法,而不是 size()==0的方式。

说明:在某些集合中,前者的时间复杂度为 O(1),而且可读性更好。

正例:

Map<String,Object>map=newHashMap<>(16);

if(map.isEmpty()) {

System.out.println("no element in this map.");

}

3.【强制】在使用 java.util.stream.Collectors 类的 toMap()方法转为 Map 集合时,一定要使用含有参数类型为 BinaryOperator,参数名为 mergeFunction 的方法,否则当出现相同 key 值时会抛出 IllegalStateException 异常。

说明:参数 mergeFunction 的作用是当出现 key 重复时,自定义对 value 的处理策略。

正例:

List<Pair<String,Double>>pairArrayList=newArrayList<>(3);

pairArrayList.add(newPair<>("version",12.10));

pairArrayList.add(newPair<>("version",12.19));

pairArrayList.add(newPair<>("version",6.28));

Map<String,Double>map=pairArrayList.stream().collect(

// 生成的 map 集合中只有一个键值对:{version=6.28}

Collectors.toMap(Pair::getKey,Pair::getValue, (v1,v2)->v2));

反例:

String[]departments=newString[] {"iERP","iERP","EIBU"};

// 抛出 IllegalStateException 异常

Map<Integer,String>map=Arrays.stream(departments)

.collect(Collectors.toMap(String::hashCode,str->str));

4.【强制】在使用 java.util.stream.Collectors 类的 toMap()方法转为 Map集合时,一定要注意当value 为 null 时会抛 NPE异常。

说明:在 java.util.HashMap 的 merge 方法里会进行如下的判断:

if(value==null||remappingFunction==null)

throw newNullPointerException();

反例:

List<Pair<String,Double>>pairArrayList=newArrayList<>(2);

pairArrayList.add(newPair<>("version1",8.3));

pairArrayList.add(newPair<>("version2",null));

Map<String,Double>map=pairArrayList.stream().collect(

// 抛出 NullPointerException 异常

Collectors.toMap(Pair::getKey,Pair::getValue, (v1,v2)->v2));

5.【强制】ArrayList 的 subList 结果不可强转成 ArrayList,否则会抛出 ClassCastException异常:java.util.RandomAccessSubList cannot be cast to java.util.ArrayList。

说明:subList()返回的是 ArrayList 的内部类 SubList,并不是 ArrayList 本身,而是 ArrayList 的一个视图,对于 SubList 的所有操作最终会反映到原列表上。

6.【强制】使用 Map 的方法keySet()/values()/entrySet()返回集合对象时,不可以对其进行添加元素操作,否则会抛出 UnsupportedOperationException 异常。

7.【强制】Collections 类返回的对象,如:emptyList()/singletonList()等都是 immutable list,不可对其进行添加或者删除元素的操作。

反例:如果查询无结果,返回 Collections.emptyList()空集合对象,调用方一旦进行了添加元素的操作,就会触发 UnsupportedOperationException 异常。

8.【强制】在 subList 场景中,高度注意对父集合元素的增加或删除,均会导致子列表的遍历、增加、删除产生ConcurrentModificationException异常。

9.【强制】使用集合转数组的方法,必须使用集合的 toArray(T[] array),传入的是类型完全一致、长度为 0 的空数组。

反例:直接使用toArray 无参方法存在问题,此方法返回值只能是 Object[]类,若强转其它类型数组将出现 ClassCastException错误。

正例:

List<String>list=newArrayList<>(2);

list.add("guan");

list.add("bao");

String[]array=list.toArray(newString[0]);

说明:使用toArray 带参方法,数组空间大小的 length:

1)等于 0,动态创建与 size 相同的数组,性能最好。

2)大于 0 但小于 size,重新创建大小等于 size 的数组,增加 GC 负担。

3)等于 size,在高并发情况下,数组创建完成之后,size 正在变大的情况下,负面影响与 2 相同

4)大于 size,空间浪费,且在size 处插入 null 值,存在 NPE隐患。

10.【强制】在使用Collection 接口任何实现类的 addAll()方法时,都要对输入的集合参数进行 NPE判断。

说明:在 ArrayList#addAll 方法的第一行代码即 Object[] a = c.toArray(); 其中c 为输入集合参数,如果为 null,则直接抛出异常。

11.【强制】使用工具类Arrays.asList()把数组转换成集合时,不能使用其修改集合相关的方法,它的 add/remove/clear 方法会抛出 UnsupportedOperationException 异常。

说明:asList 的返回对象是一个 Arrays 内部类,并没有实现集合的修改方法。Arrays.asList 体现的是适配器模式,只是转换接口,后台的数据仍是数组。

String[] str = new String[] { "chen", "yang", "hao" };

List list = Arrays.asList(str);

第一种情况:list.add("yangguanbao"); 运行时异常。

第二种情况:str[0] = "change";也会随之修改,反之亦然。

?12.【强制】泛型通配符<? extends T>来接收返回的数据,此写法的泛型集合不能使用 add 方法,而<? super T>不能使用 get 方法,两者在接口调用赋值的场景中容易出错。

说明:扩展说一下 PECS(Producer Extends Consumer Super)原则:第一、频繁往外读取内容的,适合用 <? extends T>。第二、经常往里插入的,适合用<? super T>

13.【强制】在无泛型限制定义的集合赋值给泛型限制的集合时,在使用集合元素时,需要进行instanceof 判断,避免抛出 ClassCastException异常。

说明:毕竟泛型是在 JDK5 后才出现,考虑到向前兼容,编译器是允许非泛型集合与泛型集合互相赋值

反例:

List<String>generics=null;

List notGenerics=newArrayList(10);

notGenerics.add(newObject());

notGenerics.add(newInteger(1));

generics=notGenerics;

// 此处抛出 ClassCastException 异常

String string=generics.get(0);

14.【强制】不要在foreach 循环里进行元素的 remove/add操作。remove 元素请使用 Iterator 方式,如果并发操作,需要对 Iterator 对象加锁。

正例:

List<String>list=newArrayList<>();

list.add("1");

list.add("2");

Iterator<String>iterator=list.iterator();

while(iterator.hasNext()) {

String item=iterator.next();

if(删除元素的条件) {

iterator.remove();

}

}

反例:

for(String item:list) {

if("1".equals(item)) {

list.remove(item);

}

}

说明:以上代码的执行结果肯定会出乎大家的意料,那么试一下把“1”换成“2”,会是同样的结果吗?

15.【强制】在 JDK7 版本及以上,Comparator 实现类要满足如下三个条件,不然 Arrays.sort,Collections.sort 会抛 IllegalArgumentException 异常。

说明:三个条件如下

1)x,y 的比较结果和 y,x 的比较结果相反。

2)x>y,y>z,则 x>z。

3)x=y,则 x,z 比较结果和 y,z比较结果相同。

反例:下例中没有处理相等的情况,交换两个对象判断结果并不互反,不符合第一个条件,在实际使用中可能会出现异常。

newComparator<Student>() {

@Override

public intcompare(Student o1,Student o2) {

returno1.getId()>o2.getId()?1: -1;

}

};

16.【推荐】集合泛型定义时,在 JDK7 及以上,使用 diamond 语法或全省略。

说明:菱形泛型,即 diamond,直接使用<>来指代前边已经指定的类型。

正例:

// diamond 方式,即<>

HashMap<String,String>userCache=newHashMap<>(16);

// 全省略方式

ArrayList<User>users=newArrayList(10);

17.【推荐】集合初始化时,指定集合初始值大小。

说明:HashMap 使用 HashMap(int initialCapacity) 初始化,如果暂时无法确定集合大小,那么指定默认值(16)即可。

正例:initialCapacity = (需要存储的元素个数 / 负载因子) + 1。注意负载因子(即 loader factor)默认 为 0.75,如果暂时无法确定初始值大小,请设置为 16(即默认值)。

反例:HashMap 需要放置 1024 个元素,由于没有设置容量初始大小,随着元素增加而被迫不断扩容,resize()方法总共会调用 8 次,反复重建哈希表和数据迁移。当放置的集合元素个数达千万级时会影响程序 性能。

18.【推荐】使用entrySet 遍历 Map 类集合 KV,而不是 keySet 方式进行遍历。

说明:keySet 其实是遍历了 2 次,一次是转为 Iterator 对象,另一次是从 hashMap 中取出 key 所对应的 value。而 entrySet 只是遍历了一次就把 key 和 value 都放到了 entry 中,效率更高。如果是 JDK8,使用Map.forEach方法。

正例:values()返回的是 V 值集合,是一个 list 集合对象;keySet()返回的是 K 值集合,是一个 Set 集合对象;entrySet()返回的是 K-V 值组合集合。

19.【推荐】高度注意 Map 类集合K/V 能不能存储 null值的情况,如下表格:

反例:由于 HashMap 的干扰,很多人认为 ConcurrentHashMap 是可以置入 null 值,而事实上,存储 null 值时会抛出 NPE异常。

20.【参考】合理利用好集合的有序性(sort)和稳定性(order),避免集合的无序性(unsort)和不稳定性(unorder)带来的负面影响。

说明:有序性是指遍历的结果是按某种比较规则依次排列的。稳定性指集合每次遍历的元素次序是一定的。

如:ArrayList 是 order/unsort;HashMap 是 unorder/unsort;TreeSet 是 order/sort。

21.【参考】利用 Set 元素唯一的特性,可以快速对一个集合进行去重操作,避免使用 List 的contains()进行遍历去重或者判断包含操作。

相关文章
|
4月前
|
设计模式 移动开发 Java
【阿里规约】阿里开发手册解读——代码格式篇
本文所有代码格式规范遵循《阿里规约》,从编码、换行符、空格规则、括号规则、字符数等方面展开,详细阐述方法参数、强制转换、运算符、缩进等元素的编写规范。
【阿里规约】阿里开发手册解读——代码格式篇
|
5月前
|
JSON 缓存 前端开发
阿里开发手册 嵩山版-编程规约 (十) 前后端规约
《阿里开发手册 嵩山版》中关于前后端规约的部分,涵盖了前后端交互的API设计、数据格式、错误处理、安全性等关键编程规约,目的是确保前后端开发高效协同,提升软件交付质量。
 阿里开发手册 嵩山版-编程规约 (十) 前后端规约
|
5月前
|
IDE 安全 Java
阿里开发手册 嵩山版-编程规约 (九) 注释规约
《阿里开发手册 嵩山版》中关于注释规约的部分,强调了注释的重要性和编写规范,包括Javadoc的使用、类和方法注释的要求、以及如何有效使用注释来提高代码的可读性和维护性。
 阿里开发手册 嵩山版-编程规约 (九) 注释规约
|
5月前
|
JSON 缓存 前端开发
阿里开发手册 嵩山版-编程规约 (十一) 其它
这篇文章是《阿里开发手册 嵩山版》中关于前后端规约的部分,涵盖了前后端交互的API设计、数据格式、错误处理、安全性等关键编程规约,目的是确保前后端开发高效协同,提升软件交付质量。
 阿里开发手册 嵩山版-编程规约 (十一) 其它
|
5月前
|
IDE 安全 Java
阿里开发手册 嵩山版-编程规约 (三)代码格式
《阿里开发手册 嵩山版》的编程规约部分详细介绍了代码格式规范,包括括号使用、空格、注释、行数限制等,旨在提高代码的可读性和维护性。
|
5月前
|
设计模式 安全 Java
阿里开发手册 嵩山版-编程规约 (一)命名规范
该文章主要介绍了阿里开发手册嵩山版中关于编程规约的命名规范,包括代码命名的强制和推荐规定,以及接口、类、枚举等的命名规则和各层命名规约等内容。
 阿里开发手册 嵩山版-编程规约 (一)命名规范
|
5月前
|
安全 Java 测试技术
阿里开发手册 嵩山版-编程规约 (七)并发处理
《阿里开发手册 嵩山版》中关于并发处理的编程规约并发处理部分,涵盖了线程安全、线程池使用、锁机制、并发工具类使用等最佳实践,旨在指导开发者高效、安全地处理并发问题。
|
5月前
|
安全 Java 测试技术
阿里开发手册 嵩山版-编程规约 (八)控制语句
这篇文章是《阿里开发手册 嵩山版》中关于控制语句的编程规约部分,提供了代码编写中控制流语句使用的最佳实践,包括switch-case、if-else、循环等语句的使用规范,以提升代码的可读性和健壮性。
|
5月前
|
缓存 安全 Java
阿里开发手册 嵩山版-编程规约 (二)常量定义
《阿里开发手册 嵩山版》是阿里巴巴集团技术团队的集体智慧结晶,旨在通过编程规约、异常日志、单元测试等多个维度的规范,提升Java开发者的编码效率和质量,确保软件的稳定性和安全性。本篇为编程规约 (二)常量定义。
|
5月前
|
安全 Java 测试技术
阿里开发手册 嵩山版-编程规约 (五)日期时间的规范
《阿里开发手册 嵩山版》的日期时间规范部分提供了关于日期时间处理的强制性和推荐性规约,包括日期格式化、时间获取、避免硬编码日期、处理闰年问题等,以确保程序在时间处理上的准确性和稳定性。