作者:尹正杰
版权声明:原创作品,谢绝转载!否则将追究法律责任。
从1996年初Sun公司发布的JDK 1.0中所包含的Sun Classic VM到今天,曾经涌现、浬灭过 许多或经典或优秀或有特色的虚拟机实现,我们先暂且把代码与技术放下,一 起来回顾一下Java虚拟机家族的发展轨迹和历史变迁。
一.Sun Classic/Exact VM
以今天的视角来看 , Sun Classic VM的技术可能很原始,这款虚拟机的使命也早已终结。但仅凭它"世界上第一款商用Java虚拟机"的头衔,就足够有让历史记住它的理由。
1996年1月23日,Sun公司发布JDK 1.0,Java语言首次拥有了商用的正式运行环境,这个 JDK中所带的虚拟机就是Classic VM。这款虚拟机只能使用纯解释器方式来执行Java代 码 , 如果要使用JIT编译器 ,就必须进行外挂。但是假如外挂了JIT编译器 ,JIT编译器就完全接管了虚拟机的执行系统,解释器便不再工作了。用户在这款虚拟机上执行java-version命令 ,将会看到类似下面这行输出:
java version"l.2.2"
Classic VM (build JDK\-1.2.2-001 ,green threads,sunwjit )
其中的“sunwjit”就是Sun提供的外挂编译器,其他类似的外挂编译器还有Symantec JIT和 shuJIT等。由于解释器和编译器不能配合工作,这就意味着如果要使用编译器执行,编译器就不得不对每一个方法、每一行代码都进行编译,而无论它们执行的频率是否具有编译的价 值。基于程序响应时间的压力,这些编译器根本不敢应用编译耗时稍高的优化技术,因此这个阶段的虚拟机即使用了JIT编译器输出本地代码,执行效率也和传统的C/C++程序有很大差 距 ,“Java语言很慢”的形象就是在这时候开始在用户心中树立起来的。
Sun的虚拟机团队努力去解决Classic VM所面临的各种问题,提升运行效率。在JDK 1.2 时 ,曾在Solaris平台上发布过一款名为Exact VM的虚拟机,它的执行系统已经具备现代高性能虚拟机的雏形:如两级即时编译器、编译器与解释器混合工作模式等。 Exact VM因它使用 准确式内存管理( Exact Memory Management,也可以叫Non-Conservative/Accurate MemoryManagement)而得名,即虚拟机可以知道内存中某个位置的数据具体是什么类型。譬如内存中有一个32位的整数123456,它到底是一个reference类型指向123456的内存地址还是一个数值为123456的整数,虚拟机将有能力分辨出来,这样才能在GC ( 垃圾收集)的时候准确判断堆上的数据是否还可能被使用。由于使用了准确式内存管理, Exact VM可以拋弃以前 Classic VM基于handler的对象查找方式(原因是进行GC后对象将可能会被移动位置,如果将地址为123456的对象移动到654321,在没有明确信息表明内存中哪些数据是reference的前提 下 ,虚拟机是不敢把内存中所有为123456的值改成654321的 ,所以要使用句柄来保持 reference值的稳定),这样每次定位对象都少了 一次间接查找的开销,提升执行性能。
虽然Exact VM的技术相对Classic VM来说先进了许多,但是在商业应用上只存在了很短暂的时间就被更为优矣的HotSpot VM所取代,甚至还没来得及发布Windows和Linux平台下的商用版本。而Classic VM的生命周期则相对长了许多,它在JDK 1.2之前是Sun JDK中唯一 的虚拟机,在JDK 1.2时 ,它与HotSpot VM并存,但默认使用的是Classic VM (用户可用java- hotspot参数切换至HotSpot VM) ,而在JDK 1.3时,HotSpot VM成为默认虚拟机,但Classic VM仍作为虚拟机的“备用选择”发布(使用java-classic参数切换),直到JDK 1.4的时候 ,Classic VM才完全退出商用虚拟机的历史舞台,与Exact VM—起进入了Sun Labs Research VM之中。
二.Sun HotSpot VM
提起HotSpot VM ,相信所有Java程序员都知道,它是Sun JDK和OpenJDK中所带的虚拟 机,也是目前使用范围最广的Java虚拟机。但不一定所有人都知道的是,这个目前看起来“血统纯正”的虚拟机在最初并非由Sun公司开发,而是由一家名为“Longview Technologies”的小公司设计的;甚至这个虚拟机最初并非是为Java语言而开发的,它来源于 Strongtalk VM ,而这款虚拟机中相当多的技术又是来源于一款支持Selfi吾言实现“达到C语言 50%以上的执行效率” 的目标而设计的虚拟机,Sun公司注意到了这款虚拟机在JIT编译上有许多优秀的理念和实际效果,在1997年收购了Longview Technologies公司 ,从而获得了HotSpot VM。
HotSpot VM既继承了Sun之前两款商用虚拟机的优点(如前面提到的准确式内存管理 ),也有许多自己新的技术优势,如它名称中的HotSpot指的就是它的热点代码探测技术( 其实两个VM基本上是同时期的独立产品,HotSpot还稍早一些,HotSpot—开始就是准确式 GC,而Exact VM之中也有与HotSpot几乎一样的热点探测。为了Exact VM和HotSpot VM哪个成为Sun主要支持的VM产品 ,在Sun公司内部还有过争论,HotSpot打败Exact并不能算技术上的胜利) , HotSpot VM的热点代码探测能力可以通过执行计数器找出最具有编译价值的代码 ,然后通知JIT编译器以方法为单位进行编译。如果一个方法被频繁调用,或方法中有效 循环次数很多,将会分别触发标准编译和OSR ( 栈上替换)编译动作。通过编译器与解释器恰当地协同工作,可以在最优化的程序响应时间与最佳执行性能中取得平衡,而且无须等待本地代码输出才能执行程序,即时编译的时间压力也相对减小,这样有助于引入更多的代码优化技术,输出质量更高的本地代码。
在2006年的JavaOne大会上,Sun公司宣布最终会把Java开源 ,并在随后的一年,陆续将JDK的各个部分(其中当然也包括了HotSpot VM ) 在GPL协议下公开了源码,并在此基础上建立了OpenJDK。这样 , HotSpot VM便成为了Sun JDK和OpenJDK两个实现极度接近的JDK项目的共同虛拟机。
在2008年和2009年 ,Oracle公司分别收购了BEA公司和Sun公司 ,这样Oracle就同时拥有了两款优秀的Java虚 : JRockit VM和HotSpot VM。Oracle公司宣布在不久的将来(大约应在发布JDK 8的时候)会完成这两款虚拟机的整合工作,使之优势互补。整合的方式大致上是在HotSpot的基础上,移植JRockit的优秀特性,譬如使用JRockit的垃圾回收器与 MissionControl服务 ,使用HotSpot的JIT编译器与混合的运行时系统。
三.Sun Mobile-Embedded VM/Meta-Circular VM
Sun公司所研发的虚拟机可不仅有前面介绍的服务器、桌面领域的商用虚拟机,除此之外 ,Sun公司面对移动和嵌入式市场,也发布过虚拟机产品,另外还有一类虚拟机,在设计之初就没抱有商用的目的,仅仅是用于研究、验证某种技术和观点,又或者是作为一些规范的标准实现。这些虚拟机对于大部分不从事相关领域开发的Java程序员来说可能比较陌生。
Sun公司发布的其他Java虚拟机有:
(1)KVM
KVM中的K是“Kilobyte”的意思,它强调简单、轻量、高度可移植,但是运行速度比较慢。在Android、iOS等智能手机操作系统出现前曾经在手机平台上得到非常广泛的应用。
(2)CDC/CLDC HotSpot Implementation
CDC/CLDC全称是Connected ( Limited ) Device Configuration,在JSR-139/JSR-218规范中进行定义,它希望在手机、电子书、PDA等设备上建立统一的Java编程接口,而CDC-HI VM 和CLDC-HIVM则是它们的一组参考实现。CDC/CLDC是整个Java ME的重要支柱,但从目前Android和iOS二分天下的移动数字设备市场看来,在这个领域中,Sun的虚拟机所面临的局面远不如服务器和桌面领域乐观。
(3)Squawk VM
Squawk VM由Sun公司开发,运行于Sun SPOT ( Sun Small Programmable Object Technology , —种手持的WiFi设备),也曾经运用于Java Card。这是一个Java代码比重很高的嵌入式虚拟机实现,其中诸如类加载器、字节码验证器、垃圾收集器、解释器、编译器和线程调度都是Java语言本身完成的,仅仅靠C语言来编写设备I/O和必要的本地代码。
(4)JavalnJava
JavalnJava是Sun公司于1997年〜1998年间研发的一个实验室性质的虚拟机,从名字就可以看出,它试图以Java语言来实现Java语言本身的运行环境,既所谓的“元循环” (Meta\-Circular ,是指使用语言自身来实现其运行环境)。它必须运行在另外一个宿主虚拟机之上 ,内部没有JIT编译器,代码只能以解释模式执行。在20世纪末主流Java虚拟机都未能很好解决性能问题的时代,开发这种项目,其执行速度可想而知。
(5)Maxine VM
Maxine VM和上面的JavalnJava非常相似,它也是一个几乎全部以Java代码实现(只有用于启动JVM的加载器使用C语言编写 )的元循环Java虚拟机。这个项目于2005年开始 ,到现在仍然在发展之中,比起JavaInJava,Maxine VM就显得“靠谱”很 多 ,它有先进的JIT编译器和 垃圾收集器(但没有解释器),可在宿主模式或独立模式下执行,其执行效率已经接近了HotSpot Client VM的水平。
四.BEA JRockit/IBM J9 VM
前面介绍了Sun公司的各种虚拟机,除了Sun公司以外,其他组织、公司也研发过不少虚拟机实现,其中规模最大、最著名的就是BEA和IBM公司了。
JRockit VM曾经号称“世界上速度最快的Java虚拟机” (广告词,貌似J9 VM也这样说过),它是BEA公司在2002年从Appeal Virtual Machines公司收购的虚拟机。BEA公司将其发展为一款专门为服务器硬件和服务器端应用场景高度优化的虚拟机,由于专注于服务器端应用 ,它可以不太关注程序启动速度,因此JRockit内部不包含解析器实现,全部代码都靠即时编译器编译运执行。除此之外,JRockit的垃圾收集器和MissionControl服务套件等部分的实现 ,在么多Java虚拟机中也一直处于领先水平。
IBM J9 VM并不是IBM公司唯一的Java虚拟机 ,不过是目前其主力发展的Java虚拟机。 IBM J9 VM原本是内部开发代号,正式名称是“IBM Technology for Java Virtual Machine”,简称IT4J,只是这个名字太拗口了一点,普及程度不如J9。J9 VM最初是由IBM Ottawa实验室一个名为SmallTalk的虚拟机扩展而来的,当时这个虚拟机有一个bug是由8k值定义错误引起 的,工程师花了很长时间终于发现并解决了这个错误,此后这个版本的虚拟机就称为K8了, 后来扩展出支持Java的虚拟机就被称为J9了。与BEA JRockit专注于服务器端应用不同, IBM J9的市场定位与Sun HotSpot比较接近,它是一款设计上从服务器端到桌面应用再到嵌入式都全面考虑的多用途虚拟机,J9的开发目的是作为IBM公司各种Java产品的执行平台,它的主要市场是和IBM产品(如IBM WebSphere等)搭配以及在IBM AIX和z/OS这些平台上部署Java 应用。
五.Azul VM/BEA Liquid VM高性能Java虚拟机
我们平时所提及的“高性能Java虚拟机一般是指HotSpot、JRockit、J9这类在通用平台上 运行的商用虚拟机,但其实Azul VM和BEA Liquid VM这类特定硬件平台专有的虚拟机才 是“高性能”的武器。
Azul VM是Azul Systems公司在HotSpot基础上进行大量改进,运行于Azul Systems公司的专有硬件Vega系统上的Java虚拟机 ,每个Azul VM实例都可以管理至少数十个CPU和数百GB内存的硬件资源,并提供在巨大内存范围内实现可控的GC时间的垃圾收集器、为专有硬件优化的线程调度等优秀特性。在2010年 , Azul Systems公司开始从硬件转向软件,发布了自己的ZingJVM,可以在通用x86平台上提供接近于Vega系统的特性。
Liquid VM即是现在的JRockit VE ( Virtual Edition ),它是BEA公司开发的,可以直接运行在自家Hypervisor系统上的JRockit VM的虚拟化版本, Liquid VM不需要操作系统的支持, 或者说它自己本身实现了一个专用操作系统的必要功能,如文件系统、网络支持等。由虚拟机越过通用操作系统直接控制硬件可以获得很多好处,如在线程调度时,不需要再进行内核态/用户态的切换等,这样可以最大限度地发挥硬件的能力,提升Java程序的执行性能。
六.Apache Harmony/Google Android Dalvik VM
Harmony VM和Dalvik VM只能称做“虚拟机”,而不能称做“Java虚拟机”,但 是这两款虚拟机(以及所代表的技术体系)对最近几年的Java世界产生了非常大的影响和挑战 ,甚至有些悲观的评论家认为成熟的Java生态系统有崩溃的可能。
Apache Harmony是一个Apache软件基金会旗下以Apache License协议开源的实际兼容于JDK 1.5和JDK 1.6的Java程序运行平台,这个介绍相当拗口。它包含自己的虚拟机和Java库 , 用户可以在上面运行Eclipse、Tomcat、Maven等常见的Java程序 ,但是它没有通过TCK认证 ,所以我们不得不用那么一长串拗口的语言来介绍它,而不能用一句“Apache的JDK”来说明。如果一个公司要宣布自己的运行平台“兼容于Java语言”,那就必须要通过TCK ( Technology Compatibility Kit) 的兼容性测试。Apache基金会曾要求Sun公司提供TCK的 使用授权,但是一直遭到拒绝,直到Oracle公司收购了Sun公司之后,双方关系越闹越僵,最终导致Apache愤然退出JCP ( Java Community Process ) 组织 ,这是目前为止Java社区最严重的一次“分裂”。
在Sun将JDK开源形成OpenJDK之后, Apache Harmony开源的优势被极大地削弱,甚至连 Harmony项目的最大参与者IBM公司也宣布舍去Harmony项目管理主席的职位,并参与 OpenJDK项目的开发。虽然Harmony没有经过真正大规模的商业运用,但是它的许多代码(基本上是Java库部分的代码)被吸纳进IBM的JDK 7实现及Google Android SDK之中,尤其是对Android的发展起到了很大的推动作用。
说到Android ,这个时下最热门的移动数码设备平台在最近几年间的发展过程中所取得的成果已经远远超越了Java ME在过去十多年所获得的成果,Android让Java语言真正走进了移动数码设备领域,只是走的并非Sun公司原本想象的那一条路。
Dalvik VM是Android平台的核心组成部分之一,它的名字来源于冰岛一个名为Dalvik的小渔村。Dalvik VM并不是一个Java虚拟机,它没有遵循Java虚拟机规范,不能直接执行Java的Class文件 ,使用的是寄存器架构而不是JVM中常见的栈架构。但是它与Java又有着千丝万缕的联系,它执行的dex(Dalvik Executable)文件可以通过Class文件转化而来,使用Java语法编写应用程序,可以直接使用大部分的Java API等。目前Dalvik VM随着Android一起处于迅猛发展阶段,在Android2.2中已提供即时编译器实现,在执行性能上有了很大的提高。
七.Microsoft JVM及其他
在十几年的Java虚拟机发展过程中,除去上面介绍的那些被大规模商业应用过的Java虚拟机外 ,还有许多虚拟机是不为人知的或者曾经“绚丽”过但最终湮灭的。我们以其中微软公司的JVM为例来介绍一下。
也许Java程序员听起来可能会觉得惊讶,微软公司曾经是Java技术的铁杆支持者(也必须承认,与Sun公司争夺Java的控制权,令Java从跨平台技术变为绑定在Windows上的术是微软公司的主要目的)。在Java语言诞生的初期(1996年〜1998年 ,以JDK 1.2发布为分界 ),它的主要应用之一是在浏览器中运行Java Applets程 序 ,微软公司为了在IE3中支持Java Applets应用而开发了自己的Java虚拟机,虽然这款虚拟机只有Windows平台的版本,却是当时Windows下性能最好的Java虚拟机,它在1997年和1998年连续两年获得了《 PC Magazine》杂志的“编辑选择奖”。但好景不长,在1997年10月 ,Sun公司正式以侵犯商标、不 正当竞争等罪名控告微软公司,在随后对微软公司的垄断调查之中,这款虚拟机也曾作为证据之一被呈送法庭。这场官司的结果是微软公司赔偿2000万美金给Sun公司 (最终微软公司因垄断赔偿给Sun公司的总金额高达10亿美元),承诺终止其Java虚拟机的发展,并逐步在产品中移除Java虚拟机相关功能。具有讽刺意味的是,到最后在Windows XP SP3中Java虚拟 机被完全抹去的时候,Sun公司却又到处登报希望微软公司不要这样做 。 Windows XP高级产品经理Jim Cullinan称 :“我们花费了3年的时间和Sun打官司,当时他们试图阻止我们在 Windows中支持Java ,现在我们这样做了,可他们又在抱怨,这太具有讽刺意味了。 ”
我们试想一下,如果当年Sun公司没有起诉微软公司,微软公司继续保持着对Java技术的热情 ,那Java的世界会变得怎么样呢?.NET技术是否会发展起来?但历史是没有假设的。 其他在本节中没有介绍到的Java虚拟机还有(当然,应该还有很多笔者所不知道的):
JamVM.
cacaovm.
SableVM.
Kaffe.
Jelatine JVM.
NanoVM.
Moxie JVM.
Jikes RVM.
八.TaobaoVM
由于淘宝目前无疑是中国最大的Java技术应用方,那么淘宝究竟是采用什么样的技术对Java虚拟机进行优化的呢?
淘宝的技术团队对Java虚拟机的优化工作其实早已不是停留在简单的参数调制上面,而是充分结合了企业自身的业务特点以及实际的应用场景,在OpenJDK的基础之上通过修改大量的HotSpot源代码,深度定制了淘宝专属的高性能Java虚拟机——TaobaoVM。
既然是结合业务特点深度定制的一款Java虚拟机,那么性能必然在某一些特定的应用场景上会比Oracle官方的HotSpot更强。但如果需要应用在实际的项目中,笔者还是建议三思而后行,否则将会得不偿失。就像很多人还是比较喜欢Nginx而对Tengine并不是特别友好。
除了在性能优化方面下足了功夫,TaobaoVM还在HotSpot的基础之上大幅度扩充了一些特定的增强实现。比如创新的GCIH(GC invisible heap)技术实现off\-heap,这样一来就可以将生命周期较长的Java对象从heap中移至heap之外,并且GC不能管理GCIH内部的Java对象,这样做最大的好处就是降低了GC的回收平率以及提升了GC的回收效率,并且GCIH中的对象还能够在多个Java虚拟机进程中实现共享。其他扩充技术还有利用PMU hardware的Java profiling tool和诊断协助功能等。