1.2 程序
编程的基础是程序(program)。因为本书是一本关于编程的书,所以有必要正规地定义程序这个术语。一个比较广义的定义是:程序包括一系列可以由计算机执行的指令。但是,“程序”这个术语根据上下文可以有不同的意义。这是由于程序有两种基本形式:一种形式是人类可以阅读的形式,另一种是机器可以阅读的形式。
在写程序时,可以创建一个文本文件保存程序的源代码(source code)。源代码是一种人类可以阅读的程序的形式。一般程序员所认为的“程序”就是指这种形式。但是,这并不是计算机实际运行的形式。程序的源代码必须转化成计算机能执行的指令。这种形式称为目标代码(object code)。目标代码很难(几乎不可能)由人类阅读。这也是为什么程序员只编辑程序的源程序,而只在需要运行它的时候才将它转化为目标代码。
将源程序转化为目标代码的程序称为编译器(compiler)。在一些情况下,编译器生成能由计算机CPU直接运行的机器指令。(例如,C++编程语言的编译器一般都是以这种方式工作的。)理解目标代码的一个关键点是它为某种特定的CPU设计。正如前面所解释的那样,为一种CPU设计的机器指令一般不能在另一种CPU上工作。
有人会惊奇地会发现,在某些情况下,编译器生成的目标代码中的指令并不为任意一种实际的CPU设计。相反,它们运行在虚拟机(virtual machine)上。虚拟机是一种用软件模拟CPU的程序。于是,它本质上创建了一个逻辑的CPU,而不是硬件的CPU。这样,它定义了自己可执行的指令集。这些指令的执行过程通常称为解释(interpret)。虚拟机有时也称为解释器(interpreter)。在后文将会看到,Java使用虚拟机,这种方法带来了巨大的好处。
无论源代码编译为可以直接运行的机器指令,或编译为可由虚拟机运行的代码,编译器将源代码转化为目标代码的过程是一样的。