对于每个java程序员来说class文件应该是每天都会接触的,一个class文件都对应着唯一的一个类或接口的定义信息,但是对应class文件的具体存储结构并不一定很清楚,所以本文就梳理下class文件的结构
Class文件
Class文件是一组8位字节为基础单位的二进制流,各个数据项严格按照顺序紧凑的排列在Class文件中,中间没有添加任何分隔符,整个class文件中存储的内容几乎全部是程序运行的必要数据,没有空隙存在。
Class文件格式采用一种类似于C语言结构体的伪结构来存储数据,这种结构体只有两种数据类型:无符号数和表
无符号数
无符号数属于基本的数据类型,以u1,u2,u4,u8来分别表示1个字节,2个字节,4个字节和8个字节的无符号数,无符号数可以用来描述数字,索引引用,数量值或者按照UTF-8编码结构构成字符串值。
表
表是由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯性地一"_info"结尾,表用于描述有层次关系的复合结构的数据,整个class文件本质上就是一张表,class的完整结构如下:
类型 名称 数量
u4 magic(魔数) 1
u2 minor_version(次版本号) 1
u2 major_version(主版本号) 1
u2 constant_pool_count(常量池计数器) 1
cp_info constant_pool(常量池表) constant_pool_count-1
u2 aaccess_flags(访问标志) 1
u2 this_class(类索引) 1
u2 super_class(父类索引) 1
u2 interfaces_count(接口索引计数器) 1
u2 interfaces(接口索引集合) interfaces_count
u2 fields_count(当前类字段计数器) 1
field_info fields(字段表集合) fields_count
u2 methods_count(方法计数器) 1
method_info methods(方法表集合) methods_count
u2 attributes_count(属性计数器) 1
attribute_info attributes(属性表集合) attributes_count
无论是无符号数还是表,当需要描述同一类型但数量不定的多个数据时,经常会使用一个前置的容器加若干个连续的数据项的形式,这时称这一系列连续的某一类型的数据为某一类型的集合。注意:class文件中存储的数据项都是被严格限定的,哪个字节代表什么含义,长度是多少,先后顺序如何,都不允许改变。
为了便于查看class的结构我们通过一个java文件编译出对应的class文件然后通过WinHex工具或者classpy来查看。
public class Test { private int a; public int run(){ System.out.println("波波烤鸭"); return a=1; } }
WinHex查看class文件:
classPy查看
部分内容说明
1.魔数
每个Class文件的头4个字节成为魔数(Magic Number),它的唯一作用是确定这个文件是否为一个能被虚拟机接收的Class文件。所有Class文件,魔数均为0xCAFEBABE。
注意:不仅仅是Class文件,还有很多文件(如:gif、jpeg等)都是以魔数(而不以后缀名)来进行身份识别的。
2.版本号
紧接着魔数后的4个字节是版本号,第5和第6是次版本号,第7和第8是主版本号。本文中使用的jdk版本是8所以版本信息如下:
Class文件能够被版本号对应jdk版本(或比对应版本高)的jdk加载,不能被比对应jdk版本低的jdk加载。jdk中的版本号是从45开始的,每个jdk的target参数(如果有的话)的参数值对应一个主版本号
参考《深入理解Java虚拟机》