编译Lambda表达式: Scala和Java 8

简介:

最近几年Lambda表达式风靡于编程界. 很多现代编程语言都把它作为函数式编程的基本组成部分. 基于JVM的编程语言如Scala,Groovy还有Clojure把它们作为关键部分集成在语言中.现在Java8也加入了它们的行列.

有趣的是,对于JVM来说,Lambda表达式是完全不可见的,并没有匿名函数和Lamada表达式的概念,它只知道字节码是严格面向对象规范的.它取决于语言的作者和它的编译器在规范限制内创造出更新,更高级的语言元素.

我们第一次接触它是在我们要给Takipi添加Scala支持的时候, 我们不得不深入研究Scala的编译器.伴随着JAVA8的来临,我认为探究Scala和java编译器是如何实现Lambda表达式是非常有趣的事情.结果也是相当出人意料.

接下来,我展示一个简单的Lambda表达式,用于将字符串集合转化成字符串自身长度的集合。

Java的写法 –

1 List names = Arrays.asList("1""2""3");
2 Stream lengths = names.stream().map(name -> name.length());

Scala的写法 –

1 val names = List("1""2""3")
2 val lengths = names.map(name =>name.length)

表面上看起来非常简单,那么后面的复杂东西是怎么搞的呢?

一起分析Scala的实现方式

SCalaLam-1

The Code

我使用javap(jdk自带的工具)去查看Scala编译器编译出来的class类中所包含的字节码内容。让我们一起看看最终的字节码(这是JVM将真正执行的)

1 // 加载names对象引用,压入操作栈(JVM把它当成变量#2)
2 // 它将停留一会,直到被map函数调用.
3 aload_2

接下来的东西变得更加有趣了,编译器产生的一个合成类的实例被创建和初始化。从JVM角度,就是通过这个对象持有Lambda方法的。有趣的是虽然Lambda被定义为我们方法的一个组成部分,但实际上它完全存在于我们的类之外。

01 new myLambdas/Lambda1$$anonfun$1 //new一个lambda实例变量.
02 dup //把lambda实例变量引用压入操作栈.
03  
04 // 最后,调用它的构造方法.记住,对于JVM来说,它仅仅只是一个普通对象.
05 invokespecial myLambdas/Lambda1$$anonfun$1/()V
06  
07 //这两行长的代码加载了用于创建list的immutable.List CanBuildFrom工厂。
08 //这个工厂模式是Scala集合架构的一部分。
09 getstatic scala/collection/immutable/List$/MODULE$
10 Lscala/collection/immutable/List$;
11 invokevirtual scala/collection/immutable/List$/canBuildFrom()
12 Lscala/collection/generic/CanBuildFrom;
13  
14 // 现在我们的操作栈中已经有了Lambda对象和工厂
15 // 接下来的步骤是调用map函数。
16 // 如果你记得,我们一开始已经将names对象引用压入操作栈顶。
17 // names对象现在被作为map方法调用的实例,
18 // 它也可以接受Lambda对象和工厂用于生成一个包含字符串长度的新集合。
19 invokevirtual scala/collection/immutable/List/map(Lscala/Function1;
20 Lscala/collection/generic/CanBuildFrom;)Ljava/lang/Object;

但是,等等,Lambda对象内部到底发生了什么呢?

Lambda 对象

Lambda类衍生自scala.runtime.AbstractFunction1。通过调用map函数可以多态调用被重写的apply方法,被重写的apply方法代码如下:

01 aload_0 //加载this对象引用到操作栈
02 aload_1 //加载字符串参数到操作栈
03 checkcast java/lang/String //检查是不是字符串类型
04  
05 // 调用合成类中重写的apply方法
06 invokevirtual myLambdas/Lambda1$$anonfun$1/apply(Ljava/lang/String;)I
07  
08 //包装返回值
09 invokestatic scala/runtime/BoxesRunTime/boxToInteger(I)Ljava/lang/Integer
10 areturn

真正用于执行length()操作的代码被嵌套在额外的apply方法中,用于简单的返回我们所期望的字符串长度。

我们前面走了一段很长的路,终于到这边了:

1 aload_1
2 invokevirtual java/lang/String/length()I
3 ireturn

对于我们上面写的简单的代码,最后生成了大量的字节码,一个额外的类和一堆新的方法。当然,这并不意味着会让我们放弃使用Lambda(我们是在写scala,不是C)。这仅仅表明了这些结构后面的复杂性.试想Lambda表达式的代码和复杂的东西将被编译成复杂的执行链。

我预计Java8会以相同的方式实现Lambda,但出人意料的是,他们使用了另一种完全不同的方式。

Java 8  – 新的实现方式

JavaLam-1

Java8的实现,字节码比较短,但是做的事情却很意外。它一开始很简单地加载names变量,并且调用它的stream方法,但它接下来做的东东就显得很优雅了.它使用一个Java7加入的一个新指令invokeDynamic去动态地连接lambda函数的真正调用点,从而代替创建一个用于包装lambda函数的对象.

01 aload_1 //加载names对象引用,压入操作栈
02  
03 //调用它的stream()方法
04 invokeinterface java/util/List.stream:()Ljava/util/stream/Stream;
05  
06 //神奇的invokeDynamic指令!
07 invokedynamic #0:apply:()Ljava/util/function/Function;
08  
09 //调用map方法
10 invokeinterface java/util/stream/Stream.map:
11 (Ljava/util/function/Function;)Ljava/util/stream/Stream;

神奇的InvokeDynamic指令. 这个是JAVA 7新加入的指令,它使得JVM限制少了,并且允许动态语言运行时绑定符号.

动态链接. 如果你看到invokedynamic指令,你会发现实际上没有任何Lambda函数的引用(名为lambda$0),这是因为invokedynamic的设计方式,简单地说就是lambda的名称和签名,如我们的例子-

1 // 一个名为Lamda$0的方法,获得一个字符串参数并返回一个Integer对象
2 lambdas/Lambda1.lambda$0:(Ljava/lang/String;)Ljava/lang/Integer;

他们保存在.class文件中一个单独的表的条目中,执行invokedynamic时会将#0参数传给指令指针。这个新的表的确在很多年后的今天首次改变了字节码规范的结构,这也就需要我们改编Takipi的错误分析引擎来配合。

The Lambda code

下面这个字节码是真正的lambda表达式.然后就是千篇一律地、简单地加载字符串参数,调用length方法获得长度,并且包装返回值.注意它是作为静态方法编译的,从而避免了传递一个额外的this对象给他,就像我们前面看到的Scala中的做法.

1 aload_0
2 invokevirtual java/lang/String.length:()
3 invokestatic java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
4 areturn

invokedynamic 方式的另一个优点是,它允许我们使用map函数多态地调用这个方法,而不需要去实例化一个封装对象或调用重写的方法.非常酷吧!

总结:探究java,这个最严格的的现代编程语言是如何使用动态连接加强它的lambda表达式是非常吸引人的事情.这是一个非常高效的方式,不需要额外的类加载,也不需要编译,Lambda方法是我们类中的另一个简单的私有方法.

Java 8 使用Java 7中引入的新技术,使用一个非常直接的方式实现了Lambda表达式,干得非常漂亮。像java这样”端庄”的淑女也可以教我们一些新的花样真是非常让人高兴。

fredForBlog

文章转自 并发编程网-ifeve.com

目录
相关文章
|
4天前
|
并行计算 Java 编译器
Java Lambda表达式简介
Java Lambda表达式简介
11 0
|
5天前
|
Java API
Java Lambda
Java Lambda
14 0
|
5天前
|
Java 开发者
探索 Java 的函数式接口和 Lambda 表达式
【4月更文挑战第19天】Java 中的函数式接口和 Lambda 表达式提供了简洁、灵活的编程方式。函数式接口有且仅有一个抽象方法,用于与 Lambda(一种匿名函数语法)配合,简化代码并增强可读性。Lambda 表达式的优点在于其简洁性和灵活性,常用于事件处理、过滤和排序等场景。使用时注意兼容性和变量作用域,它们能提高代码效率和可维护性。
|
8天前
|
分布式计算 Java API
Java 8新特性之Lambda表达式与Stream API
【4月更文挑战第16天】本文将介绍Java 8中的两个重要新特性:Lambda表达式和Stream API。Lambda表达式是Java 8中引入的一种新的编程语法,它允许我们将函数作为参数传递给其他方法,从而使代码更加简洁、易读。Stream API是Java 8中引入的一种新的数据处理方式,它允许我们以声明式的方式处理数据,从而使代码更加简洁、高效。本文将通过实例代码详细讲解这两个新特性的使用方法和优势。
|
12天前
|
Java
Java 14 强势登场:Switch 表达式的进化之路
Java 14 强势登场:Switch 表达式的进化之路
16 0
|
14天前
|
Java 开发者
Java中的Lambda表达式:简洁、灵活的编程利器
在现代软件开发中,编写简洁、高效的代码是至关重要的。Java中的Lambda表达式为开发者提供了一种简洁、灵活的编程方式,使得代码更具可读性和可维护性。本文将探讨Lambda表达式的基本概念、语法结构以及在实际项目中的应用,以帮助读者更好地理解和运用这一强大的编程工具。
6 0
|
7月前
|
Java 编译器 开发者
java中运行时异常与编译时异常?
java中运行时异常与编译时异常?
|
1天前
|
安全 Java 调度
Java线程:深入理解与实战应用
Java线程:深入理解与实战应用
9 0