CLR要求对象必须使用new运算符创建,在使用new运算符创建一个对象时具体都做了些什么呢?
1.计算所有定义的实例字段,所有的基类型包括System.Object需要分配的字节数。
每一个堆上的对象还需要两个额外的成员:类型对象指针 和同步块索引,CLR使用它们来管理对象。它们两个需要的字节数算在对象的大小里面。
2.从托管堆分配对象需要的字节数(也就是给对象分配内存)。所有的字节置为0
3.初始化类型对象指针 和同步块索引
4.调用实例构造器。大多数编译器自动生成调用基类构造器的代码。最终会调用Sytem.Object的构造器,这个构造器方法什么也不做,只是return。
在new执行完上面的操作以后,返回一个新创建的对象的引用,这个引用保存在实例对象变量里。如:A a=new A(); 保存在变量a里。
is和as运算符
//o是一个Object对象 Employee是一个类 if(o is Employee) { Employee e=(Employee)o; ... }
上面的代码是关于is非常典型的应用,这里CLR会进行两次类型 检查:①is运算符检查 ②执行强转的时候检查。CLR的类型检查提高了安全性,同时也会消耗一部分性能。C#提供了as运算符来简化代码并且改善性能。
Employee e=o as Employee; if(e!=null) { //... }
这里CLR会检查o的类型是否兼容Employee,如果兼容则返回Employee对象的引用,否则返回null。这里只执行了一次类型检查。
运行时类型,对象,线程堆栈,托管堆之间的联系
当创建一个线程时,会分配1M的堆栈空间,用来向方法传递参数以及存放定义在方法里面的局部变量。堆栈的建造是从高位内存地址向地位内存地址进行。下面演示一个线程执行调用M1方法的过程:
M1方法执行时,首先会在堆栈上为name变量分配内存:
接着M1调用M2方法,将name局部变量作为参数参数传递,name变量的地址进栈:
接着会执行M2方法,首先还是给length和tally两个局部变量从堆栈上分配内存:
M2执行到return语句,返回到M1,继续执行。
调用静态方法,实例方法以及虚方法之间的不同
internal class Employee { public Int32 GetYearsEmployed() { ... } public virtual String GetProgressReport() { ... } public static Employee Lookup(String name) { ... } } internal sealed class Manager : Employee { public override String GetProgressReport() { ... } }
加入代码接着调用M3方法,M3方法包含的代码阐释了CLR的运行原理(一般可能不这样写代码)
上图展示CLR载入到进程,托管堆初始化。
当JIT编译器将M3的IL代码编译为本地CPU指令时,CLR会保证定义这些类型的程序集加载。使用程序集的元数据,CLR这些类型的信息并创建一些数据结构来呈现类型本身。关于Employee和Manager类型展示如下:
(Int32和String是常用的类型,这里没有展示)
1.在定义一个类型时,可以定义一个静态数据字段,存放类型对象本身的内存分配的字节数。每一个类型对象里面是一个包含每个方法入口的方法表,这里的Employee定义了GetYearsEmployed , GetProgressReport, 和Lookup三个方法,所以在Employee的方法表里面有三个入口。在CLR确定了所有的方法被创建并编译之后,线程开始执行M3的CPU指令。同样,这里会为M3方法的局部变量分配内存,(初值为0或null)。
2.接着M3执行构造器创建Manager对象,
3.接着执行下面的代码,M3调用静态方法Lookup。当调用静态方法时,JIT编译器会定位到跟定义静态方法相对应的类型对象。然后,JIT编译器定位到方法表的入口处。Lookup方法在堆上构造了一个Manager对象并且返回该对象的地址。保存在变量e中,此时e不再指向开始new出来的那个Manager对象,开始的Manager对象已经没有变量引用它。在未来某个时候GC会对它进行回收。
4.接着M3调用非虚方法的实例方法GetYearsEmployed,CLR会定位到与变量e类型一致的对象。(如果Employee没有定义该方法,JIT编译器会向上一层层查找直到Object。)
然后JIT编译器定位到对象的方法表,这里可以看出相对于静态方法多了一步定位。编译该方法(如果之前没有编译过),调用编译后的代码。
5.接着M3调用虚方法实例方法GetProgressReport,调用时,JIT会生成一些额外的代码,这些代码在每一次方法调用时都会执行,它会首先会查找发起调用的变量,然后跟随地址来调用对象。这里的e变量执行了Manager对象,生成的额外的代码会检查对象内部的类型对象指针,该指针成员引用了实际的对象的类型。然后定位到对象的方法表,接着编译。
注 《CLR via C#》(Jeffrey Richter著)——.NET 界的经典之作,读的过程写点笔记跟大家分享,我也推荐大家看英文版,能够直接领会原意