Java 泛型详细解析

本文涉及的产品
应用实时监控服务-用户体验监控,每月100OCU免费额度
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
应用实时监控服务-应用监控,每月50GB免费额度
简介: 本文将带你详细解析 Java 泛型,了解泛型的原理、常见的使用方法以及泛型的局限性,让你对泛型有更深入的了解。

泛型的定义

泛型类的定义

下面定义了一个泛型类 Pair,它有一个泛型参数 T

public class Pair<T> {
   
    private T start;
    private T end;
}

实际使用的时候就可以给这个 T 指定任何实际的类型,比如下面所示,就指定了实际类型为 LocalDate,泛型给了我们一个错觉就是通过个这个模板类 Pair<T>,我们可以在实际使用的时候动态的派生出各种实际的类型,比如这里的 Pair<LocalDate> 类。

Pair<LocalDate> period = new Pair<>();

泛型类的继承

子类是一个泛型类的定义方法如下:

public class Interval<T> extend Pair<T> {
   }

这里的 Interval<T> 类是一个泛型类,也可以像上面使用 Pair<T> 类一样给它指定实际的类型。

子类是一个具体类的定义方法如下:

public class DateInterval extends Pair<LocalDate> {
   }

这里的 DateInterval 类就是一个具体的类,而不再是一个泛型类了。这里的语义是 DateInteral 类继承了 Pair<LocalDate> 类,这里的 Pair<LocalDate> 类也是一个具体类。但是由于 Java 的泛型实现机制,这里会带来多态上的一个问题,见下面的分析。

而像下面的这种定义具体类的写法是错误的:

public class DateInterval<LocalDate> extends Pair<LocalDate> {
   }

泛型方法的定义

泛型方法定义时,类型变量放在修饰符的后面,返回值的前面。泛型方法既可以泛型类中定义,在普通类中定义。

public static <T> T genericMethod(T a) {
   }

这里顺便记录一下,因为是使用擦除来实现的泛型,因此字节码中的方法的签名是不会包含泛型信息的。对于泛型方法会多生成一个 Signature 的属性,用于记录方法带泛型信息的签名,反编译器也可以根据这个信息将泛型方法还原回来。
image.png
image.png

构造函数泛型

下面的代码定义了一个泛型类 ConstructorGeneric,它的泛型参数是 T,这个类的构造函数也是泛型的,它有一个泛型参数 X

class ConstructorGeneric<T> {
   
    public <X> ConstructorGeneric(X a) {
   }
}

创建该对象的代码如下:

ConstructorGeneric<Number> t = new <String>ConstructorGeneric<Number>("123");

这里 new 后面的 String 是传给构造器的泛型 X 的,即 X 的实际类型为 String;类的范型参数是由 Number 传递的,即 T 的实际类型是 Number。这里两个都是省略,写在这里是为了显示区分出两个参数传递的位置。

类型变量的限定

带单个上界限定
下面的代码定义了一个 NatualNumber 类,它的泛型参数 T 限制为 Integer 或者 Integer 的子类。

public class NaturalNumber<T extends Integer> {
   
    private T n;

    public NaturalNumber(T n)  {
    this.n = n; }

    public boolean isEven() {
   
        return n.intValue() % 2 == 0;
    }
}

调用代码如下:

// 正常
NaturalNumber<Integer> natural1 = new NaturalNumber<>(1);  

// 无法编译,因为这里和泛型类定义的上界不符合
NaturalNumber<Double> natualral2 = new NaturalNumber<>(1.0);

带多个上界的限定
多个上界之间使用 & 符号进行分隔,如果多个限定中有类,则类需要排在接口后面(因为 Java 不支持多继承,所以不存在有多个限定的类的情况)。使用时需要满足所有的限定条件才能执行,这个校验应该是在编译时期做的,因为擦除之后,只会保留第一个限定界。

class A {
   }
interface B {
   }
class C extends A implements B {
   }
public static <T extends A & B> void test(T a) {
   }

public static void main(String[] args) {
   
    // 编译错误,A 只能满足一个上界
    test(new A());
    // 正常
    test(new C());
}

通配符

在泛型中使用 ? 表示通配符,它的语义是表示未知的类型。通配符可以用作方法的形参、字段的定义、局部变量的定义,以及有的时候作为函数的返回值。通配符不能作为实参调用泛型方法,不能创建对象,或者派生子类型。

上界通配符

当你想定义一个普通方法,这个普通方法可以处理某一类的 List 中的元素时,比如像:List<Number>List<Integer>List<Double> 时,这个时候如果你把方法的入参定义为 List<Number> 是不行的,因为在 Java 中 List<Integer> 不是 List<Number> 的子类。

public static void process(List<Number> numbers) {
   }

// 编译错误
List<Number> numbers = new ArrayList<>();
proess(numbers);

假设 List 是 List 的子类,则可以实现如下的代码:

List<Integer> integers = new ArrayList<>();

// 假设下面是成立的
List<Number> numbers = integers;

// 下面这句也应该是合法的,但是这违背了 intergers 只能存放 Integer 的语义
numbers.add(new Double());

从上面的例子可以看出,如果允许 List<Integer>List<Number> 的子类型,则会破坏泛型的语义,因此这在 Java 中是不允许的。

但是又实际存在上面描述的这种需求,因此 Java 提供了上界通配符的语法,则方法定义可以定义为如下:

public static void process(List<? extends Number> numbers) {
   
    for (Number num : numbers) {
   
        // do something
    }
}

// 下面的调用都是能够正常编译通过的
List<Number> numbers = new ArrayList<>();
process(numbers);

List<Integer> integers = new ArrayList<>();
process(integers);

List<Double> doubles = new ArrayList<>();
process(doubles);

这里的 ? extends Number 的语义就是可以匹配 Number 或者 Number 子类的 List,需要注意的是在 Java 中的继承(extends)和实现(implements)在这里都用关键字 extends 来表示。

从这里也可以看出,List<? extends Number> 的返回值是可以赋值给 Number 类型的。这里可以想象一下 Listget() 方法的泛型参数 E 就变成了? extends Number 这个实际类型,而它表达的语义是 Number 以及 Number 的子类,因此赋值给一个 Number 类型的变量是合法的。

但是下面的代码是不合法的:

public static void process(List<? extends Number> numbers) {
   
    numbers.add(new Integer());
}

这里同样可以想象一下 Listadd() 方法的入参的泛型参数 E 就变成了 ? extends Number 这个实际类型,它表达的语义是 Number 以及 Number 的子类,但是具体是哪个子类是无法确定的。上面的例子也解释了它可能是 NumberIntegerDouble 等,假设它是 Double 类型,这里放一个 Integer 类型,又违背了泛型只能放 Double 的语义,因此这里的赋值是不合法的。

无界通配符

下面的代码就是定义了一个 List<?> 形参的方法,这里的 List<?> 语义是一个未知类型的 List

public static void printList(List<?> list) {
   }

无界通配符定义的 List 里面的元素只能赋值给 Object 类型。这里可以想象一下 Listget() 方法的泛型参数 E 就变成了 ? 这个实际类型,它的语义是一个未知的类型,既然是一个未知的类型那么我只能赋值给 Object 类型的变量了。

public static void printList(List<?> list) {
   
    for (Object obj : list) {
   
        // do something
    }
}

无界通配符定义的 List 里面只能添加 null,不能添加其它的任何类型的元素,即使是 Object 也不行,因为添加了之后就会违背泛型的语义了。

无界通配符的主要使用场景是:

  • 需要使用 Object 类中的方法
  • 使用了泛型类中不用关心泛型的方法,比如 List 中的 size()clear() 方法

    下界通配符

在使用上面的上界通配时,发现了一个问题,如果一个 List 类型形参声明为了上界通配符,是没有办法往这个 List 里面添加元素的,为了解决这个问题,可以使用下界通配符,可以定义如下的方法:

public static void addNumbers(List<? super Number> list) {
   
    list.add(new Integer());
    list.add(new Double());
}

这里可以想象一下这个时候 Listadd() 方法的入参的泛型参数 E 就变成了 ? super Integer 类型,它的语义是匹配 Number 以及 Number 类型的超类。根据 Java 多态的原理,这里实际可以传递的类型为 Integer 以及 Integer 的子类型,因为形参声明的是超类,实际传递子类的引用当然是合法的。

泛型继承关系

泛型的继承关系如下图所示:

image.png

通配符捕获

假设定义了一个无界限通配符的方法如下,这个方法会编译错误,因为按照之前分析的 List<?> 中不能添加任何类型的对象,而这里 list.get(0) 返回的是 Object 类型的对象,肯定是无法放入进去的。代码如下:

public void foo(List<?> list) {
   
    list.set(0, list.get(0)); // 编译报错
}

为了解决这个问题这个时候就可以通过新建一个私有的泛型方法来帮助捕获通配符的类型,这个私有的泛型方法名称通常是原有方法加上Helper后缀,这种技巧称为通配符捕获。代码如下:

pulic void foo(List<?> list) {
   
    // 调用这个方法的语义是告诉编译器我不知道具体类型是什么,
    // 但是取出来和放进去的元素类型是相同的
    fooHelper(list);
}

private <T> void fooHelper(List<T> list) {
   
    // 合法
    T temp = list.get(0);
    // 合法
    list.set(0, temp);
}

对于泛型方法,因为 add() 方法的入参,get() 方法返回值的泛型参数都是 T,当传入一个 List 进来,虽然这个 List 里面的对象实际类型不知道,但是通过泛型参数可以判断 get() 方法返回类型和 add() 方法的入参类型都是一样的,都是 T 捕获到的一个实际类型 X

对于带通配符参数的方法,因为方法的声明没有一个泛型参数,不能捕获到实际的参数类型 X。那么对于每次方法的调用编译器都会认为是一个不同的类型。比如编译器编译的时候 list.set(0, xxx),这里的入参的类型就会是 CAP#1list.get(0) 返回的类型就是 CAP#2,因为没有一个泛型参数来告诉编译器说 CAP#1CAP#2 是一样的类型,因此编译器就会认为这两个是不同的类型,从而拒绝编译。下图是编译器实际的提示信息:
image.png

image.png
从上面的图也可以看出,第二次调用方法时,类型又变成 CAP#3CAP#4 了,这也证明了每次编译器都会认为是一个新的类型。

实际上这里也可以将这个私有的 Helper 方法定义为公共的,然后去掉通配符的方法。这两种定义实际上是达到了相同的效果,但是 Java 语言规范 5.1.10 章节中更推荐采用通配符的方式定义,但它上面阐述的原因没太看懂,但是在另外一篇博客里面看到一个观点感觉有点道理。
image.png

它说如果定义成一个泛型方法,那么老的遗留的没有用泛型的代码调用这个方法就会产生一个警告,但是如果是使用通配符则不会有警告产生。

public static void foo1(List<?>) {
   }

public static <T> void foo2(List<T>) {
   }

// 假设老的代码没有用泛型
List rawList = Arrays.asList("1", "2");
// 不会产生告警
foo1(rawList);
// 会产生告警,提示未经检查的转换
foo2(rawList);

然而实际上 JDK 中真正的实现并没有采用这种方式,而是直接用注解忽略了异常,直接用的原生类型来实现的。Collections 中的 reverse() 方法内部实现逻辑如下:

@SuppressWarnings({
   "rawtypes", "unchecked"})  
public static void reverse(List<?> list) {
     
    int size = list.size();  
    if (size < REVERSE_THRESHOLD || list instanceof RandomAccess) {
     
        for (int i=0, mid=size>>1, j=size-1; i<mid; i++, j--)  
            swap(list, i, j);  
    } else {
     
        // instead of using a raw type here, it's possible to capture 
        // the wildcard but it will require a call to a supplementary         // private method 
        ListIterator fwd = list.listIterator();  
        ListIterator rev = list.listIterator(size);  
        for (int i=0, mid=list.size()>>1; i<mid; i++) {
     
            Object tmp = fwd.next();  
            fwd.set(rev.previous());  
            rev.set(tmp);  
        }  
    }  
}

桥接方法

假设定义了如下代码:

public class Node<T> {
   
    public T data;
    public Node(T data) {
    this.data = data; }
    public void setData(T data) {
   
        System.out.println("Node.setData");
        this.data = data;
    }
}

public class MyNode extends Node<Integer> {
   
    public MyNode(Integer data) {
    super(data); }
    public void setData(Integer data) {
   
        System.out.println("MyNode.setData");
        super.setData(data);
    }
}

泛型擦除后的实际代码如下,注意看 MyNode 里面的 setData() 方法并没有重写 Node 里面的 setData() 方法了,因为方法签名不一样。这就违背了 Java 多态的语义。
Java 编译器在编译的时候会自动给 MyNode 生成一个桥接方法,这个方法的签名和 Node 类里面的一样,然后在这个方法里面去调用真正的 setData() 方法。
通过查看 MyNode.class 文件可以看到真的有两个 setData() 方法存在。
image.png

方法的形参类型是 Object 类型,和 Node 类中泛型擦除后的类型相同,说明这个方法才是真正重载了 Node 类中的方法。
image.png

方法实现中调用了 MyNode 类中形参为 Integer 类型的 setData() 方法。
image.png

同时在 MyNode 类中不允许自己定义形参为 Object 类型的 setData() 方法了,如果定义了则无法编译:
image.png

经过编译器编译后的代码等效为如下的代码:

public class Node {
   
    public Object data;
    public Node(Object data) {
    this.data = data; }
    public void setData(Object data) {
   
        System.out.println("Node.setData");
        this.data = data;
    }
}

public class MyNode extends Node<Integer> {
   
    public MyNode(Integer data) {
    super(data); }
    public void setData(Integer data) {
   
        System.out.println("MyNode.setData");
        super.setData(data);
    }

    // 由编译器生成的桥接方法
    // 如果手动定义了这个方法编译器就会报错了
    public void setData(Object data) {
   
        setData((Integer) data);
    }
}

泛型的局限性

泛型不能用于基本类型

泛型是通过擦除实现的,擦除之后 ArrayList 内部是 Object[] 类型的数组,是不能存放基本类型的,因为基本类型不是 Object 类型的子类。

List<int> list = new ArrayList<>();

不能创建泛型类型的实例

泛型是通过擦除来实现的,所以擦除之后都会变成 new Object() (没有指定上界的情况),而实际上我们是要创建 T 类型的实例的。

public static <T> void test(List<T> list) {
   
    E ele = new E();
    list.add(ele);
}

// 可以通过如下方式
public static <T> void test(List<T> list, Class<T> clazz) {
   
    E ele = clazz.newInstance();
    list.add(ele);
}
// 调用
List<String> list = new ArrayList<>();
test(list, String.class);

不能声明静态的泛型变量

泛型相当于是类的工厂,可以创建不同类型的实例。而静态变量是所有实例共享的,如果允许声明静态的泛型变量,那么不同类型的实例之间就会存在矛盾。

public class MobileDevice<T> {
   
    private static T os;
}

// 这两个实例的静态变量就会存在矛盾
MobileDevice<Smartphone> phone = new MobileDevice<>();
MobileDevice<TabletPC> pc = new MobileDevice<>();

不能使用 instanceof 判断泛型类型

泛型是通过擦除实现的,因此 List<T>.class 在内存中是不存在的,只有 List.class,这个类型也被称为原生类型。

// 错误
if (list instanceof List<String>) {
   
}

// 正确
if (list instanceof List) {
   
}

不能创建泛型数组

泛型是通过擦除实现的,如果允许声明泛型数组,则无法实现数组在存放时会校验数组的元素类型这个语义。

// 假设允许创建,这个数组的每个元素只允许存放 List<String> 类型的元素
Object[] stringLists = new List<String>[2]; 
// 正确执行
stringLists[0] = new ArrayList<String>(); 
// 这行应该抛出 ArrayStoreException 异常,
// 但是由于擦除,实际上和上面是一样的,这里违背了数组的语义
stringLists[1] = new ArrayList<Integer>();

不能创建、捕获、抛出带泛型的异常

// 编译报错
class MathException<T> extends Exception {
   }    

// 编译报错
class QueueFullException<T> extends Throwable {
   }

// 编译报错
public static <T extends Exception, J> void execute(List<J> jobs) {
   
    try {
   
        for (J job : jobs)
    } catch (T e) {
     // 编译报错
    }
}

class Parser<T extends Exception> {
   
    // 这样是允许的
    // 我觉得允许的原因是声明了抛出父类,而实际抛出子类也是合法的
    public void parse(File file) throws T {
     
    }
}

不能使用擦除后原生类型相同的泛型参数方法来重载

public class Example {
   
    // 这两个方法擦除后的参数是一样的,所以不能算重载
    public void print(Set<String> strSet) {
    }
    public void print(Set<Integer> intSet) {
    }
}

堆污染

当定义变长的泛型参数时,如果尝试把一个原生类型赋值给变成泛型参数就有可能发生堆污染。堆污染的本质原因就是可以通过语法糖变长参数列表来创建泛型的的数组导致的。例如下面的代码:

public class ArrayBuilder {
   
  public static <T> void addToList (List<T> listArg, T... elements) {
   
    for (T x : elements) {
   
      listArg.add(x);
    }
  }

  public static void faultyMethod(List<String>... l) {
   
    // 这里编译应该会有告警,如果忽略这个告警,则有可能带来堆污染
    Object[] objectArray = l;   
    objectArray[0] = Arrays.asList(42);
    String s = l[0].get(0);     
  }
}

编译告警中就会提示有堆污染,如下图所示:
image.png

当编译器遇到一个变长参数方法时,它会把它转换为一个数组。对于 T... elements 这种参数声明就会转为 T[] elements,因为泛型的擦除,最终会被转换为 Object[] elements,这里编译器就会认为有可能发生堆污染。

可以通过以下三种方式抑制这种警告:

  • @SuppressWarnings({"unchecked", "varargs"})
    这种方式只能抑制方法声明时候的告警,方法调用处还是会产生告警;
    image.png
  • @SafeVarargs
    不会产生任何警告
    image.png
  • 增加 -Xlint:varags 编译选项
    不会产生任何警告
    image.png

    JVM 控制参数

显示所有告警信息

给编译器增加 -Xlint:unchecked ,在 Idea 中可以参考如下图配置:
image.png

显示更详细的诊断信息

给编译增加 -Xdiags: verbose 选项
image.png

显示所有告警信息为英文

增加如下环境变量:
image.png
Idea 中可以将配置放在 vmproperties 文件中,如下图所示:
image.png

参考

Java Generic Tutorial
Java核心技术·卷 I(原书第10版)
深入理解Java虚拟机(第3版)
When to use generic methods and when to use wild-card?
Why use a wild card capture helper method?
Capture Conv: rev/reverse - what's the point?
Difference between <? super T> and <? extends T> in Java
What is PECS (Producer Extends Consumer Super)?
Differences between copy(List<? super T> dest, List<? extends T> src) and copy(List<T> dest, List<? extends T> src)

相关文章
|
3天前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
20天前
|
存储 人工智能 弹性计算
阿里云弹性计算_加速计算专场精华概览 | 2024云栖大会回顾
2024年9月19-21日,2024云栖大会在杭州云栖小镇举行,阿里云智能集团资深技术专家、异构计算产品技术负责人王超等多位产品、技术专家,共同带来了题为《AI Infra的前沿技术与应用实践》的专场session。本次专场重点介绍了阿里云AI Infra 产品架构与技术能力,及用户如何使用阿里云灵骏产品进行AI大模型开发、训练和应用。围绕当下大模型训练和推理的技术难点,专家们分享了如何在阿里云上实现稳定、高效、经济的大模型训练,并通过多个客户案例展示了云上大模型训练的显著优势。
|
23天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
15天前
|
并行计算 前端开发 物联网
全网首发!真·从0到1!万字长文带你入门Qwen2.5-Coder——介绍、体验、本地部署及简单微调
2024年11月12日,阿里云通义大模型团队正式开源通义千问代码模型全系列,包括6款Qwen2.5-Coder模型,每个规模包含Base和Instruct两个版本。其中32B尺寸的旗舰代码模型在多项基准评测中取得开源最佳成绩,成为全球最强开源代码模型,多项关键能力超越GPT-4o。Qwen2.5-Coder具备强大、多样和实用等优点,通过持续训练,结合源代码、文本代码混合数据及合成数据,显著提升了代码生成、推理和修复等核心任务的性能。此外,该模型还支持多种编程语言,并在人类偏好对齐方面表现出色。本文为周周的奇妙编程原创,阿里云社区首发,未经同意不得转载。
11529 10
|
8天前
|
人工智能 自然语言处理 前端开发
100个降噪蓝牙耳机免费领,用通义灵码从 0 开始打造一个完整APP
打开手机,录制下你完成的代码效果,发布到你的社交媒体,前 100 个@玺哥超Carry、@通义灵码的粉丝,可以免费获得一个降噪蓝牙耳机。
3935 13
|
15天前
|
人工智能 自然语言处理 前端开发
用通义灵码,从 0 开始打造一个完整APP,无需编程经验就可以完成
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。本教程完全免费,而且为大家准备了 100 个降噪蓝牙耳机,送给前 100 个完成的粉丝。获奖的方式非常简单,只要你跟着教程完成第一课的内容就能获得。
6570 10
|
27天前
|
缓存 监控 Linux
Python 实时获取Linux服务器信息
Python 实时获取Linux服务器信息
|
13天前
|
人工智能 自然语言处理 前端开发
什么?!通义千问也可以在线开发应用了?!
阿里巴巴推出的通义千问,是一个超大规模语言模型,旨在高效处理信息和生成创意内容。它不仅能在创意文案、办公助理、学习助手等领域提供丰富交互体验,还支持定制化解决方案。近日,通义千问推出代码模式,基于Qwen2.5-Coder模型,用户即使不懂编程也能用自然语言生成应用,如个人简历、2048小游戏等。该模式通过预置模板和灵活的自定义选项,极大简化了应用开发过程,助力用户快速实现创意。
|
1天前
|
机器学习/深度学习 人工智能 安全
通义千问开源的QwQ模型,一个会思考的AI,百炼邀您第一时间体验
Qwen团队推出新成员QwQ-32B-Preview,专注于增强AI推理能力。通过深入探索和试验,该模型在数学和编程领域展现了卓越的理解力,但仍在学习和完善中。目前,QwQ-32B-Preview已上线阿里云百炼平台,提供免费体验。
|
9天前
|
人工智能 C++ iOS开发
ollama + qwen2.5-coder + VS Code + Continue 实现本地AI 辅助写代码
本文介绍在Apple M4 MacOS环境下搭建Ollama和qwen2.5-coder模型的过程。首先通过官网或Brew安装Ollama,然后下载qwen2.5-coder模型,可通过终端命令`ollama run qwen2.5-coder`启动模型进行测试。最后,在VS Code中安装Continue插件,并配置qwen2.5-coder模型用于代码开发辅助。
677 4