【CSAPP】程序的机器级表示:基础知识

简介: 【CSAPP】程序的机器级表示:基础知识



0x00  英特尔x86处理器(Intel x86 Processors)

主导市场:

笔记本电脑、台式机、服务器。

进化的设计:

向后兼容,直到1978年推出的8086 - 随着时间的推移,增加了更多的功能。

复杂指令集计算机(CISC)

支持许多不同格式的指令。

精简指令集计算机(RISC)的性能难以匹敌!

但是英特尔已经做到了! - 在速度方面。

🔍 RISC vs. CISC

0x01  因特尔x86的演变:里程碑(Intel x86 Evolution: Milestones)

0x02  程序就像是食谱(Programs are like recipes)

0x03  冯诺依曼建筑(Von Neumann Architecture)

现代计算机的一个常见模型

指令以二进制表示,就像数据一样

指令和数据存储在存储器中

0x04  汇编/机器码视图:Assembly/Machine Code View

PC: 程序计数器:① 下一条指令的地址    ② 被称为 "RIP" (x86-64)

寄存器文件: 大量使用的程序数据

条件代码:① 存储最近的算术或逻辑操作的状态信息    ② 用于条件性分支

内存:  ①字节寻址阵列   ② 代码和用户数据    ③ 支持程序的堆栈

0x05  编译系统(Compilation System)

将高级C程序翻译成二进制代码,由处理器读取和执行。

0x06 将C语言转换为目标代码(Turning C into Object Code)

0x07  汇编和二进制编码(Assembly and Binary code)

汇编:  ① 二进制代码的文本(符号)表示   ② 计算机硬件无法理解    ③ 一系列指令

操作代码: ① 二进制格式的指令序列,可由机器读取。 ② 它将被解析到集成电路上

指令:工作的基本单位

指令指定: ① 要在CPU上执行的操作或操作码    ② 源操作数和结果的目的地

0x08  架构 - ISA指令集架构(Architecture - ISA: instruction set architecture)

软件和硬件之间的契约 / 接口

① 操作和存储位置(寄存器)的功能定义。

② 精确描述了软件如何调用和访问硬件的操作和存储。

ISA规定了汇编的语法和语义

ISA是一个新的抽象层。

① ISA规定了硬件提供的东西,而不是它的实现方式。

② 隐藏了CPU实现的复杂性。

③ 不需要改变软件(我们可以在8086(1978)和奔腾4(2003)中运行软件,因为它们是x86 ISA的实现)

0x09  定义(Definitions)

 

架构: (ISA:指令集结构)一个处理器设计中需要理解或编写汇编/机器代码的部分。例如:指令集规范、寄存器。 - 微架构。架构的实现。例如:高速缓存大小和核心频率。

代码形式: 机器代码:处理器执行的字节级程序     ② 汇编代码:机器代码的文本表示

ISA实例: ① 英特尔:x86、IA32、Itanium、x86-64 - ARM  ② 几乎所有的手机上都有在使用

0x0A  编译器命令(Compiler command)

 (assembly - 汇编     assembler - 汇编器    Linker - 链接器)

0x0B  使用GDB(Use GDB)

0x0C 机器指令示例(Machine Instruction Example)

0x0D 反汇编目标代码(Disassembling Object Code)

0x0E 穿插拆解(Alternate Disassembly)

❓ 那些东西可以被拆解?

① 任何可以被解释为可执行代码的东西

② 反汇编程序检查字节并重建汇编的源代码

0x0F  x86-64 整数寄存器(x86-64 Integer Registers)

可以引用低位字节序(大小端)(low-order) 4 字节。(也可以引用 low-order 1&2 字节)。

0x10  一些历史:IA32寄存器(Some History: IA32 Registers)

0x11 移动数据(Moving Date)

移动数据:

操作数类型:

即时数据:恒定的整数数据

例如:$0x400, $-533

像C语言的常数,但是前缀是'$'

用1,2,或4个字节编码

寄存器:16个整数寄存器之一

例如:%rax,%r13

但是 %rsp 被保留为特殊用途

其他有特殊用途的指令

内存:在寄存器给定的地址上连续8个字节的内存

举个最简单的例子:(%rax)

其他各种 "地址模式"

0x12  movq 操作数组合(movq Operand Combinations)

(无法用单条指令进行内存转移)

0x13  简单内存寻址模式(Simple Memory Addressing Modes)

💬 简单寻址模式的例子:

0x14  理解 Swap ( )

0x15  完整的内存寻址模式(Complete Memory Addressing Modes)

💬 地址计算的例子

0x16  地址计算指令(Address Computation Instruction)

是地址模式表达式

② 将 设置为表达式所表示的地址

用途:

计算没有内存引用的地址(例如,p = &x[i] 的翻译)

计算形式为  的算术表达式

例子:

0x17  一些算术运算(Some Arithmetic Operations)

注意参数的顺序!

有符号 int 和无符号 int 之间没有区别(Why?)

单操作数指令:

💬 算术表达式例子:

long arith
(long x, long y, long z)
{
    long t1 = x+y;
    long t2 = z+t1;
    long t3 = x+4;
    long t4 = y * 48;
    long t5 = t3 + t4;
    long rval = t2 * t5;
    return rval;
}

:地址计算

:移位

:乘法(但是只使用1次)

📚 理解:

0x18  汇编特征:数据类型(Assembly Characteristics: Data Types)

1、2、4或8字节的 "整数" ① 数据  ② 数据值地址(无类型的指针)

4、8或10字节的浮点数据

代码:编码一系列指令的字节序列

没有集合类型   如数组或结构体,只是在内存中连续分配字节而已。

0x19  Assembly Characteristics: Operations

在寄存器或内存数据上执行算术函数

在内存和寄存器之间传输数据   ① 从内存加载数据到寄存器    ② 将寄存器数据存储到内存

传输控制 ① 无条件跳转到程序   ② 条件分支

0x1A  Object Code

汇编器

① 将 .s 翻译成 .o

② 每条指令的二进制编码

③  可执行代码的近乎完整的图像

④  不同文件中的代码之间缺少联系

链接器

解决文件之间的引用

与静态运行时库结合  (例如:malloc、printf)

一些库是动态链接的(程序开始执行时进行链接)


Computer Systems: A Programmer's Perspective (3rd Edition)

相关文章
第七次笔记:程序的机器级代码表示
第七次笔记:程序的机器级代码表示
114 0
第七次笔记:程序的机器级代码表示
|
Java iOS开发 编译器
深入理解计算机系统之旅(三)程序的机器级表示
1、前言 我们在使用高级语言比如C语言、OBjective-C以及Java等编写程序时,我们被屏蔽了程序的具体机器级的实现,这个屏蔽的工具就是编译器(Java是解释执行,但是它同样也需要将文本的源码进行一定的翻译,转换为字节码)。
878 0
|
存储 前端开发 rax
深入理解计算机系统-第3章程序的机器级表示笔记
计算机执行机器代码,用字节序列编码低级的操作,包括处理数据、管理内存、读写存储设备上的数据,以及利用网络通信。编译器基于编程语言的规则、目标机器的指令集和操作系统遵循的惯例,经过一系列阶段生成机器代码。
153 0
|
存储 Linux 程序员
3、深入理解计算机系统笔记:程序的机器级表示
1、Intel现在称其指令集为IA32,即Intel 32位体系结构(Intel Architecture 32-bit),这个处理器也俗称为“x86”。 2、Linux使用了平面寻址方式(flat addressing),在这种寻址方式中,程序员将整个存储空间看做一个大的字节数组。
919 0
|
存储 自然语言处理 前端开发
解读《深入理解计算机系统 (CSAPP)》第 3 章程序的机器级表示
C语言机器级编程通过让编译器产生机器级程序的汇编代码表示,了解了编译器以及机器、数据类型和指令集
解读《深入理解计算机系统 (CSAPP)》第 3 章程序的机器级表示
|
监控 Shell Apache
【原创】单独监控系统负载脚本
最近有个需求,要写一些简单的shell脚本实时关注系统状态,以下是自己写的几个脚本仅供参考。 1、每隔十分钟监控系统负载输出到已当前日期命名的文件中,另外只保留最近一周的数据。 2、每隔一分钟监控磁盘IO的负载输出到当前日期命名的文件中,只保留最近一周的数据。
951 0
|
6月前
|
调度
项目环境测试问题之单机调度会导致项目环境大部分的机器被闲置如何解决
项目环境测试问题之单机调度会导致项目环境大部分的机器被闲置如何解决
|
监控 数据可视化 Java
双CPU监控的目的以及主流编程语言实现代码示例
监控CPU使用率可以帮助检测系统瓶颈和性能问题,有助于及时识别并解决故障。
511 2
|
自然语言处理 算法 大数据
|
9月前
|
存储 Java 调度
Java多线程基础-1:通俗简介操作系统之进程的管理与调度
操作系统是一个复杂的软件,具备许多功能。其中,进程的管理与调度是与我们密切相关的。本文将对操作系统功能中进程管理与调度作出介绍。
93 0

热门文章

最新文章