Java - 为什么Java的泛型要用“擦除“实现

简介: Java - 为什么Java的泛型要用“擦除“实现

前言

在 Java 中的 泛型,常常被称之为 伪泛型,究其原因是因为在实际代码的运行中,将实际类型参数的信息擦除掉了(Type Erasure)。那是什么原因导致了 Java 做出这种妥协的呢?下面我就带着大家以 Java 语言设计者的角度,带领大家一起了解这里面的辛酸过往。


什么是真泛型

在了解 Java "伪泛型" 之前,我们先简单讲一讲"真泛型"与“伪泛型”的区别。

  • 真泛型:泛型中的类型是真实存在的。
  • 伪泛型:仅于编译时类型检查,在运行时擦除类型信息。


编程语言实现“真泛型”的一般思路

一般编程语言引入泛型的思路,都是通过编译时膨胀法

以 Java 语言实现"真泛型"为例,首先,对泛型类型(泛型类、泛型接口)泛型方法的名字使用特别的编码,例如将 Factory<T> 类生成为一个名为 “Factory@@T” 的类,这种特别的编码后的名字将被编译器识别,作为判断是否为泛型的依据。方法中使用占位符 T 的地方可以临时生成为 Object ,并带上特别的 Annotation 让 Java 编译器能得知这个是占位符。然后,如果编译时发现有对 Factory<String> 的使用,则将 “Factory@@T” 的所有逻辑复制一份,新建 “Factory@String@” 类,将原本的占位符 T 替换为 String 。然后在编译 new Factory<String>() 时生成 new Factory@String@() 即可。

术语 中文含义 举例
Parameterized type 参数化类型 List<String>
Actual type parameter 实际类型参数 String
Formal type parameter 形式类型参数 E

Factory<String>Factory<Integer> 为例,其生成的代码为:

// 替换前的代码Factory<String>() f1=newFactory<String>();
Factory<Integer>() f2=newFactory<Integer>();
// 替换后的代码Factory<String>() f1=newFactory@String@();
Factory<Integer>() f2=newFactory@Integer@();
  • 其中 Factory@String@ 类中的 T 已经被替换为 String。
  • 其中 Factory@Integer@ 类中的 T 已经被替换为 Integer。

因为含有不同的 实际类型参数泛型类型 都被替换为了不同的类,且泛型类型中的类型也都得到了确认。所以我们在程序中可以这么做:

classFactory<T> {
Tdata;
publicstaticvoidf(Objectarg){
if(arginstanceofT){...} // successTvar=newT(); // successT[] array=newT[10]; // success    }
}

Java 直接使用 “真泛型” 带来的问题

单从技术来说,Java 是完全 100% 能实现我们所说的 ”真泛型”。想要实现真泛型,有如下两件事Java 必须要处理:

  • 修改 JVM 源代码,让 JVM 能正确的的读取和校验泛型信息(之前的Java 是没有泛型这种概念的,所以需要修改)。
  • 为了兼容老程序,需为原本不支持泛型的 API 平行添加一套泛型 API(主要是容器类型)。

就拿 ArrayList 来说,也就是必须这么做:

  • java.util.ArrayList 👈 Java 老版本
  • java.util.generic.ArrayList<T> 👈 Java5 新增泛型版本

即使以上的事情都做了,Java 也并不能采用这种方案。试想如下情况:

Java 5 中引入了泛型

image.png

  • 如何兼容老版本.png

如果我有一个 Java 5 之下 的 A 项目与第三方的 B1 lib,其中有 A 项目中引用了 B1 lib 中的某个 ArrayList ,随着 Java 的升级,B1 lib 的开发者为了使用 Java 新特性--泛型,故将代码迁移到了 Java 5,并重新生成了 B2 lib,那么 A 项目要兼容 B2 lib,那么 A 项目中必须升级到 Java 5 并同时修改代码。

A 项目为什么必须要升级 Java 5?

在 Java 中不支持高版本的 Java 编译生成的 class 文件在低版本的 JRE 上运行,如果尝试这么做,就会得到 UnsupportedClassVersionError 错误。如下图所示:

image.png

  • 版本说明.png

故 A 项目要适配 B2 lib,必要要把 Java 升级到 Java 5。

那现在我们再回过头来想想,Java 版本迭代都从 1.0 到 5.0了,有多少的开源框架,有多少项目,如果为了引入泛型,强行让开发者修改代码。这种情况,各位同学。自行脑补。估计数以万计的开发者拿着刀,在堵 Java 语言架构师的门吧。


逼不得已的类型擦除

在上节中,我们探讨了 Java 不能直接引入“真泛型” 的实际原因。因为“真泛型”的引入,势必会为原本不支持泛型的 API 平行添加一套泛型 API。而新增了API,对于 Java 开发者来说,又必须要做迁移。

那还有什么方案,能让开发者平滑的过渡到 Java 5, 又能使用泛型新特性呢?

image.png

  • 抽烟分析.jpg

有的,有的。Java 如果想摆脱用户新版本的迁移问题。Java 必要要做以下两件事情:

  • 不再新增一套泛型 API,直接把已有的类型原地泛型化
  • 处理泛化前后类型的兼容。

下面我们分别探讨一下这两件事做的目的及其原因。

做第一件事,是保证了开发者不会因为 Java 的升级,而对以前的老代码进行修改,以 ArrayList 为例,直接在原有包(java.util)下进行修改,也就是这样:

//👇Java老版本classArrayList{}
//👇Java5泛型版本classArrayList<T>{}

做第二件事的目的,还是以我们之前的例子进行分析,在 A 项目中,A 项目引用了 B1 lib 中的 ArrayList(用 list 变量记录),那么假设 A 项目升级到 Java 5 后,还是引用的 B1 lib,那么必然会出现如下这种情况:

下述代码中,A 项目将泛化后 ArrayList<T> 的传递给了 B1 lib 中的 ArrayList

ArrayListlist=newArrayList<String>();
  • 左边:B1 lib 中的老版本 ArrayList
  • 右边:A 项目 中的新泛型版本 ArrayList<T>

这种情况的出现,会导致一个问题。就是 b1 项目中的 ArrayList 是不知道 A 项目中的 Arraylist 已经泛型化了的,那么如何保证泛型化后的 ArrayList(也就是ArrayList<T>)与老版本的 ArrayList 等价呢?


如果按照我们之前讲解的 “真泛型” 思路来处理 Java 的泛型, 那么 new ArrayList<String>() 实际会被替换为 new ArrayList@String@(),那么实际运行代码是这样:

ArrayListlist=newFactory@String@();


从代码逻辑上来看,根本就跑不通。因为 ArrayListArrayList@String@ 根本就不是同一类, 那怎么办呢?

最为直接的解决方案就是,不再为参数化类型创造新类了,同时在编译期间将泛型类型中的类型参数全部替换 Object(因为不创建新类了,那么在泛型类中的 T 对应的类型,只能用 Object 替换)。

在 Java 的泛型实际实现中,会根据泛型类型中的类型参数有无边界,来选择是否替换为边界或 Object。

举个例子

image.png

  • 编译器替换.png

在上述代码中,声明了一个泛型类型 Node<T>,在编译器替换后,实际为 Node。也就是这样:

// 编译器的代码Nodenode=newNode<String>();
// 编译后的代码Nodenode=newNode();

通过编译器的”魔法“,Java 就解决了处理泛型兼容老版本的问题。

 

总结

阅读到这里,我相信大家已经明白了 Java 中的泛型为什么要擦除类型信息了。虽然 Java 的 "伪泛型“ 一直被其他编程语言所歧视,但不管怎样,兼容老版本这种行为,也是一件值得尊敬以及认可的一件事。

不管 Java 做了什么,总是功大于过的。这里推荐一个视频给大家。相信看了这个视频之后,大家会知道 Java 对于整个世界的重要性。


目录
相关文章
|
5月前
|
安全 Java 编译器
揭秘JAVA深渊:那些让你头大的最晦涩知识点,从泛型迷思到并发陷阱,你敢挑战吗?
【8月更文挑战第22天】Java中的难点常隐藏在其高级特性中,如泛型与类型擦除、并发编程中的内存可见性及指令重排,以及反射与动态代理等。这些特性虽强大却也晦涩,要求开发者深入理解JVM运作机制及计算机底层细节。例如,泛型在编译时检查类型以增强安全性,但在运行时因类型擦除而丢失类型信息,可能导致类型安全问题。并发编程中,内存可见性和指令重排对同步机制提出更高要求,不当处理会导致数据不一致。反射与动态代理虽提供运行时行为定制能力,但也增加了复杂度和性能开销。掌握这些知识需深厚的技术底蕴和实践经验。
106 2
|
2月前
|
存储 Java 编译器
Java泛型类型擦除以及类型擦除带来的问题
泛型擦除是指Java编译器在编译期间会移除所有泛型信息,使所有泛型类型在运行时都变为原始类型。例如,`List&lt;String&gt;` 和 `List&lt;Integer&gt;` 在JVM中都视为 `List`。因此,通过 `getClass()` 比较两个不同泛型类型的 `ArrayList` 实例会返回 `true`。此外,通过反射调用 `add` 方法可以向 `ArrayList&lt;Integer&gt;` 中添加字符串,进一步证明了泛型信息在运行时被擦除。
52 2
|
3月前
|
Java API
[Java]泛型
本文详细介绍了Java泛型的相关概念和使用方法,包括类型判断、继承泛型类或实现泛型接口、泛型通配符、泛型方法、泛型上下边界、静态方法中使用泛型等内容。作者通过多个示例和测试代码,深入浅出地解释了泛型的原理和应用场景,帮助读者更好地理解和掌握Java泛型的使用技巧。文章还探讨了一些常见的疑惑和误区,如泛型擦除和基本数据类型数组的使用限制。最后,作者强调了泛型在实际开发中的重要性和应用价值。
69 0
[Java]泛型
|
3月前
|
存储 安全 Java
🌱Java零基础 - 泛型详解
【10月更文挑战第7天】本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
23 1
|
4月前
|
Java 编译器 容器
Java——包装类和泛型
包装类是Java中一种特殊类,用于将基本数据类型(如 `int`、`double`、`char` 等)封装成对象。这样做可以利用对象的特性和方法。Java 提供了八种基本数据类型的包装类:`Integer` (`int`)、`Double` (`double`)、`Byte` (`byte`)、`Short` (`short`)、`Long` (`long`)、`Float` (`float`)、`Character` (`char`) 和 `Boolean` (`boolean`)。包装类可以通过 `valueOf()` 方法或自动装箱/拆箱机制创建。
49 9
Java——包装类和泛型
|
3月前
|
Java 语音技术 容器
java数据结构泛型
java数据结构泛型
34 5
|
3月前
|
存储 Java 编译器
Java集合定义其泛型
Java集合定义其泛型
24 1
|
3月前
|
存储 Java 编译器
【用Java学习数据结构系列】初识泛型
【用Java学习数据结构系列】初识泛型
26 2
|
4月前
|
安全 Java API
【Java面试题汇总】Java基础篇——String+集合+泛型+IO+异常+反射(2023版)
String常量池、String、StringBuffer、Stringbuilder有什么区别、List与Set的区别、ArrayList和LinkedList的区别、HashMap底层原理、ConcurrentHashMap、HashMap和Hashtable的区别、泛型擦除、ABA问题、IO多路复用、BIO、NIO、O、异常处理机制、反射
|
4月前
|
存储 安全 搜索推荐
Java中的泛型
【9月更文挑战第15天】在 Java 中,泛型是一种编译时类型检查机制,通过使用类型参数提升代码的安全性和重用性。其主要作用包括类型安全,避免运行时类型转换错误,以及代码重用,允许编写通用逻辑。泛型通过尖括号 `&lt;&gt;` 定义类型参数,并支持上界和下界限定,以及无界和有界通配符。使用泛型需注意类型擦除、无法创建泛型数组及基本数据类型的限制。泛型显著提高了代码的安全性和灵活性。