有关编译原理

简介: 有关编译原理 编译程序的逻辑结构:词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成。六个阶段。 1.词法分析 目的:识别字符串,识别出关键字、数字、运算符、变量名等,以二元式(类别,值)的形式存储,供后续的语法分析器用。 1.1文法: 一个文法可表示成形如G[S]=(Vn,Vt,P,S)的四元式。 Vn:非终结符号集; Vt:终结符号集; P:产生式集;

有关编译原理

编译程序的逻辑结构:词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成。六个阶段。

1.词法分析

目的:识别字符串,识别出关键字、数字、运算符、变量名等,以二元式(类别,值)的形式存储,供后续的语法分析器用。

1.1文法:

一个文法可表示成形如G[S]=(Vn,Vt,P,S)的四元式。

Vn:非终结符号集;

Vt:终结符号集;

P:产生式集;

S:文法的开始符号。

文法的分类:分析略,有以下几种。

0

1

2

3

短语结构文法

前后文有关文法

前后文无关文法

正规文法

确定的有限自动机(DFA)

DFADeterministic Finite Automaton

DFA M=K,∑,f,S0,Z)五元式表示。

K:状态集合;

∑,:符号集合;

f:单值映射,f(p,a)=q:指明若当前的状态为p,而输入字符为a时下一个状态就是q

S0:一个初始状态,属于K

Z:若干个结束状态,属于K

非确定的有限自动机(NFA)

NFANon-deterministic Finite Automaton

NFA M=K,∑,f,S0,Z)五元式表示,同DFA,区别为f可以不是单值映射,即f(p,a)={q1q2,q3,...}

NFADFA的等价性论证:

1.DFA是特殊的NFA

2.NFA可等价德转换到DFA

文法->DFA的步骤:

文法->具有ε动作的NFA->DFA确定化->DFA状态数最小化。


图1-1 词法分析的自动机示意图

 

1.2正则表达式

 又称正规文法,用来描述符合特定文法的字符串。

符号有:

 | 

名字分别叫闭包、连接、或。这三个的优先级依次降低。

正规集:某文法下的全体字符串构成了相应的正规集。

正规式

正规集(ε代表空串)

a|b

{a,b}

a|ba*

{a,b,ba,baa,...}

a*

{ε,a,aa,aaa,...}

(a|b)*abb

任何以abb结尾的a、b符号串

增强版的 正则表达式见:

 http://blog.csdn.net/chuchus/article/details/34109787

2.语法分析

以词法分析的二元式作为输入,判断是否合乎特定文法。如int a 后缺少分号,语法分析器会报错。

有自顶向下和自底向上两种思想。对于前者,试着为源程序构造一棵完整的语法树,若成功则无语法错误。

递归下降分析法,属于自顶向下。是指对文法的每一非终结符号,都根据相应产生式各候选式的结构,为其编写一个子程序,用来识别该非终结符号所表示的语法。

该方法要求文法不能有直接左递归。若有,可以对文法进行改造以达到要求。

例:

T->aFb 为语法的一部分,为非终结符号T、F分别构造相应的语法检验函数,T的判别函数见下:

T(){ ...;//判断a

F();//判断F

...;判断b

}//若中间任一环节出错则说明源程序不符合语法规定。

此类函数之间允许相互嵌套和递归。

3.语义分析

较复杂,不详述。通常与语法分析并行进行。

定义函数 void fun(int);调用 fun();时会因参数不去匹配由语义分析器报错。

4.中间代码生成

四则运算表达式的表示方法:后缀表示法。

流程控制语句的翻译:

while(a<b){if(c>d) x=y+z;}

地址

operator

参数一

参数二

结果(地址)

100

j<

a

b

102

101

j

/

/

107

102

j>

c

d

104

103

j

/

/

100

104

+

y

z

tmp

105

=

tmp

/

x

106

j

/

/

100

107

...

...

...

...

 

5.代码优化及目标代码生成

略。

 

微笑消除产生式中的直接左递归是比较容易的。例如假设非终结符P的规则为

P→Pα|β

其中,β是不以P开头的符号串。那么,我们可以把P的规则改写为如下的非直接左递归形式:
P→βP’                                            P’→αP’|ε

这两条规则和原来的规则是等价的,即两种形式从P推出的符号串是相同的。


目录
相关文章
|
1月前
|
自然语言处理 编译器 C语言
C语言编译原理
C语言编译原理涵盖将C源代码转换为可执行机器代码的全过程。主要阶段包括词法分析、语法分析、语义分析、中间代码生成、优化、目标代码生成和代码链接。词法分析将源代码分解为词法单元;语法分析构建抽象语法树;语义分析检查代码合理性;中间代码生成创建与目标机无关的代码形式;优化提升执行效率;目标代码生成转化为汇编或机器码;代码链接整合生成可执行文件。这一流程确保生成高效且正确的程序。
|
5月前
|
存储 编译器 芯片
【读书笔记】汇编语言(第四版)第一章 基础知识
【读书笔记】汇编语言(第四版)第一章 基础知识
|
5月前
|
存储 编译器 C++
详细解读C++编译原理
详细解读C++编译原理
29 0
|
自然语言处理
【编译原理】第二章,词法分析
【编译原理】第二章,词法分析
|
6月前
|
算法 安全 编译器
编译原理 - 中间表示
编译原理 - 中间表示
63 0
|
6月前
|
存储 自然语言处理 编译器
【编译原理】词法分析:C/C++实现
【编译原理】词法分析:C/C++实现
202 1
|
自然语言处理 Java 编译器
【编译原理】第一章,什么是编译原理?
【编译原理】第一章,什么是编译原理?
|
自然语言处理 IDE 开发工具
【编译原理】第三章语法分析
【编译原理】第三章语法分析
|
自然语言处理 前端开发 JavaScript
重学前端 28 # 通过四则运算的解释器快速理解编译原理
重学前端 28 # 通过四则运算的解释器快速理解编译原理
91 0