一文详解Java泛型设计

简介: 本文主要介绍泛型诞生的前世今生,特性,以及著名PECS原则的由来。

泛型的诞生


背景

在没有泛型之前,必须使用Object编写适用于多种类型的代码,想想就令人头疼,并且非常的不安全。同时由于数组的存在,设计者为了让其可以比较通用的进行处理,也让数组允许协变,这又为程序添加了一些天然的不安全因素。为了解决这些情况,Java的设计者终于在Java5中引入泛型,然而,正是因为引入泛型的时机较晚,为了兼容先前的代码,设计者也不得不做出一些限制,来让使用者(也就是我们)以难受换来一些安全。


优点

简单来说,泛型的引入有以下好处:

  • 程序更加易读
  • 安全性有所保证

以ArrayList举例,在增加泛型类之前,其通用性是用继承来实现的,ArrayList类只维护一个Object引用的数组,当我们使用这个工具类时,想要获取指定类型的对象必须经过强转:

import java.util.ArrayList;
import java.util.Date;

public class Main {
    public static void main(String[] args) {
        ArrayList list = new ArrayList();
        //强制类型转换
        String res = (String) list.get(0);
        //十分不安全的行为
        list.add(new Date());
    }
}

这种写法在编译类型时不会报错,但一旦使用get获取结果并试图将Date转换为其他类型时,很有可能出现类型转换异常,为了解决这种情况,类型参数应用而生。


类型参数

类型参数(Type parameter)使得ArrayList以及其他可能用到的集合类能够方便的指示虚拟机其包含元素的类型:

import java.util.ArrayList;

public class Main {
    public static void main(String[] args) {
        ArrayList<String> objects = new ArrayList<>();
        objects.add("Hello");
    }
}

这使得代码具有更好的可读性,并且在调用get()的时候,无需进行强转,最重要的是,编译器终于可以检查一个插入操作是否符合要求,运行时可能出现的各种类型转换错误得以在编译阶段就被阻止。

import java.util.ArrayList;
import java.util.Date;

public class Main {
    public static void main(String[] args) {
        ArrayList<String> objects = new ArrayList<>();
        //we can do it like that
        objects.add("Hello");
        //wrong example
        objects.add(new Date());
    }
}

基本用法

一般来说,使用泛型工具类很容易,但是自己编写会相对困难很多,设计者必须考虑的相当周全才能使自己的泛型类库比较完善。


泛型类

泛型类是有一个或者多个类型变量的类,泛型类中的属性可以全都不是泛型,不过一般不会这样做,毕竟类型变量在整个类上定义就是用于指定方法的返回类型以及字段的类型,定义代码如下:

public class Animal<T> {
    private String name;
    private T mouth;
    
    public T getMouth(){
        return mouth;
    }
}

泛型类可以有多个类型变量:

public class Animal<T,U> {
    private String name;
    private T mouth;
    private U eyes;

    public T getMouth(){
        return mouth;
    }
}


泛型方法

泛型方法可以在普通类中定义,也可以在泛型类中定义,例如:

public class Animal<T,U> {
    private T value;
    public static <T> T get(T... a){
        return a[a.length-1];
    }
    public T getFirst(){
        return value;
    }
}

类型擦除

虚拟机没有泛型类型对象,也就是说,所有对象在虚拟机中都属于普通类,这意味着在程序编译并运行后我们的类型变量会被擦除(erased)并替换为限定类型,擦掉类型参数后的类型就叫做原始类型(raw type),正是因为有类型参数,所以下面的比较结果会为true:

image.png

这里的替换规则我个人理解为:“替换最近上界”,也就是无限定符修饰,则为顶级父类Object,如果有,则会替换为其指定的类型。最直观的示例如下,这就是类型擦除的体现:

image.png 

前面说过,泛型是在1.5才提出的,因此类型擦除的目的就是为了保证已有的代码和类文件依然合法,也就是向低版本兼容。这样做会带来几个问题:


1.类型参数不支持基本类型,只支持引用类型,这是因为泛型会被擦除为具体类型,而Object不能存储基本类型的值。

运行时你只能对原始类型进行类型检测:

image.png

2.不能实例化类型参数

不能实例化泛型数组,因为类型擦除会将数组变为Object数组,如果允许实例化,极易造成类型转换异常。


强制转换

在编写泛型方法调用时,如果擦出了返回类型,编译器会插入强制类型转换。例如下面的代码:

public class Main {
    public static void main(String[] args) {
        Animal<Integer,Double> pair = new Animal<>();
        Integer first = pair.getFirst();
    }
}

getFirst擦除类型后的返回类型是Object,编译器自动插入转换到Integer的强制类型转换,也就是说,编译器把这个方法调用转换为两条虚拟机指令:

  • 对原始方法的调用。
  • 将返回的Object类型强制转换为Integer类型。


方法桥接

子类重写父类方法时,必须和父类保持相同的方法名称,参数列表和返回类型。那么问题来了,如果按照之前的思路来讲,当泛型父类或接口的类型参数被擦除了,那么子类岂不是不构成重写条件?(参数类型很可能变化):

擦除前:

image.png

擦除后:

image.png

为了解决这个事情,Java引入了桥接方法,为每个继承/实现泛型类/接口的子类服务,以此保持多态性,字节码如下:

image.png

(图片来源:RudeCrab)

其实现原理,就是重写擦除后的父类方法,并在其内部委托了原始的子类方法,巧妙绕过了擦除带来的影响。不仅如此,就算不是泛型类,当子类方法重写父类方法的返回类型是父类返回类型的子类时,编译器也会生成桥接方法来满足重写的规则。


总结

Java核心技术中总结的非常到位:

  • 虚拟机中没有泛型,只有普通的类和方法。
  • 所有的类型参数都会替换为他们的限定类型。
  • 会合成桥接方法来保持多态。
  • 为保持类型安全性,必要时会插入强制类型转换。


变型(Variant)与数组

变型是类型系统中很重要的概念,主要有三个规则协变,逆变,和不变:

image.png

这三个类型可以解释为:假设有一个类型构造器f,它可以将已知类型转换为另一种类型,那么,有Animal父类和Dog子类。

  • 则f(Dog)是f(Animal)的子类,称为协变;
  • 则f(Dog)是f(Animal)的父类,成为逆变;
  • 则f(Dog)和f(Animal)没有任何关系;

而这个f(),可以是泛型,可以是数组,也可以是方法。


知道了以上概念,我们需要直接指出,泛型默认是不支持协变的,原因很简单,类型安全:如果允许协变,可能会造成类型转换异常。而数组支持协变,正如文章开头所说,就是设计者希望可以对数组进行比较通用的处理,防止方法为每一种类型编写重复逻辑,这样做也确实导致为数组赋值元素时可能会抛出运行时异常ArrayStoreException,这是一个很危险的坑。Effective Java中直接指出允许数组协变是Java的缺陷,我想这也是要多用列表而不用数组的原因之一。


泛型协变—PECS原则

为了让泛型也支持多态,让其支持协变是很必要的,最常用的场景:我们想让一个方法接受一个集合,并做统一的逻辑处理,如果泛型不支持协变,这种很基本的需求都会成为奢望。


上界

让泛型支持协变很简单,只需要使用? extends的组合即可实现,?称为通配符,这种组合方式声明了类型的上界,标识泛型可接受的类型只能是指定类型或是其子类。在这里,ElectricVehicle和Diesel均是继承自Car。

image.png


为了杜绝可协变后出现类似于数组一样的安全隐患,泛型设计采用了“一刀切”的方式,即:只要声明了上界,除了null之外,一律不准传入给泛型。说白了,就是只读不写,这样当然可以保证安全性。

image.png

到这里可以顺便说一下集合的设计,可以注意到集合中只有add方法是泛型参数,而其余方法并不是,为何要这样设计,为何不把其余方法的参数类型也改为E?其原因就是在于,如果将contains和remove改为E,那么声明上界之后,调用这两个方法会引发编译错误,然而这两个方法均为类型安全方法,自然不可声明为E,add作为很明显的写方法,自然也需要用E作为参数类型,到这里,不得不感叹类库设计者的想法独到。

image.png


下界

对应协变的上界,自然有逆变的下界,很自然的,我们使用? super的组合来声明一个泛型的下界,来表示可以接收本类型或者其父类型。

image.png

而且相对应的,正是由于最多只能接收父类型泛型,所以不会有类型转换失败的风险,因此逆变可以添加元素,不过添加的元素类型只能是指定类型和其子类,切记不要把添加元素和接收泛型类参数给弄混了。


有利有弊,虽然逆变没有了协变只读不写的限制,但是读取元素时将不能确定具体的类型,只能用Object来接收:

image.png


PECS

正如上面对上下界的描述,我们已经明白了大致的应用场景,当我们需要只读不写时,就用协变,只写不读,就用逆变。又想读又想写,我们应该指明准确的泛型类型。


注明的PECS原则就总结了这一点,PECS(Prodcuer extends Consumer super),也就是说,作为元素的生产者Prodcuer,要用协变,支持元素的读取,而作为消费者Consumer,要支持逆变,支持元素的写入。

image.png

Collections的copy方法就非常好的印证了这一点:

image.png





来源  |  阿里云开发者公众号
作者  |  江归


相关文章
|
6天前
|
存储 安全 JavaScript
Java泛型的一些细节
泛型的核心思想是将类型参数化,主要目的是提供类型安全和消除类型转换,使代码更加健壮和可读。泛型在编译阶段起作用,允许在定义类、接口、方法和属性时使用类型参数。泛型的优点包括集合中存储的元素类型统一,减少类型转换;缺点是集合中元素缺乏多样性。泛型的主要作用是确保数据安全和防止类型转换错误。常见的泛型通配符包括无界通配符 `&lt;?&gt;`、上界通配符 `&lt;? extends T&gt;` 和下界通配符 `&lt;? super T&gt;`,分别用于不同场景下的类型匹配。
|
6月前
|
存储 算法 程序员
C++模板编程与泛型技术探秘
这篇文章探讨了C++中的模板编程和泛型技术,这两种技术增强了代码复用和抽象能力。文章介绍了函数模板和类模板的概念,通过示例展示了如何定义和使用它们。泛型技术是一种编程范式,强调编写与类型无关的代码,提高代码复用性和灵活性。C++11后的版本通过类型萃取和变长模板参数进一步扩展了模板功能。模板和泛型广泛应用在数据结构、算法、库和框架的开发中,如STL。掌握这些技术有助于编写更高效、灵活的代码,并推动软件开发的创新和进步。
|
6月前
|
存储 分布式计算 Java
深入探究JAVA编程语言:概念、应用与实例分析
**JAVA**是广泛应用的高级编程语言,以其易学性、跨平台能力和高效的性能著称。它采用面向对象编程,强调封装、继承和多态,且具备平台无关性、内置安全性和多线程支持。JAVA广泛应用于Web开发(如JSP、Servlet)、移动应用(Android开发)、大数据处理(Hadoop、Spark)和桌面应用。通过一个计算两数之和的简单示例,展示了JAVA的易读性和面向对象特性,帮助读者理解JAVA在实际开发中的运用。
|
6月前
|
算法 Java 程序员
[重学Python] Day6 面向对象编程 基础
面向对象编程基础讲解,包括类与对象的概念,类是对象的模板,对象是类的实例。Python中使用`class`定义类,通过`__init__`初始化对象。创建对象并调用方法如`drive`和`target_client`。访问权限在Python中相对宽松,使用单下划线表示受保护的属性。面向对象的三大支柱是封装、继承和多态,封装是隐藏实现细节,仅暴露简单接口。提供了数字时钟和平面上的点的类定义作为练习示例。
37 0
|
存储 Java
Java数据结构之第十四章、泛型进阶
Java数据结构之第十四章、泛型进阶
81 0
|
6月前
|
安全 编译器 程序员
【C++】万字一文全解【继承】及其特性__[剖析底层化繁为简](20)
【C++】万字一文全解【继承】及其特性__[剖析底层化繁为简](20)
|
Java 编译器 C语言
【JAVA数据结构】Java语法完善补充
JAVA数据结构 & Java语法完善补充
46 0
【JAVA数据结构】Java语法完善补充
|
存储 Java 数据处理
升华数组-使用链表灵活整理数据 | 带你学《Java面向对象编程》之八十九
数组的存在的确便利了大量的数据处理,但其有一个严重的限制是长度必须固定。本节将带领读者“自定义”数据结构,使用链表达到和数组一样的效果。
升华数组-使用链表灵活整理数据 | 带你学《Java面向对象编程》之八十九
泛型带你规避风险 | 带你学《Java面向对象编程》之六十四
本节由转型风险引出了一个新的概念-泛型,并为读者简单介绍了泛型的定义方法与泛型类实例化方法。