编译原理FIRST、FOLLOW、SELECT集の通俗解释-阿里云开发者社区

编译原理FIRST、FOLLOW、SELECT集の通俗解释

2018-06-29 7305

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

1.为什么要引入FIRST集的概念？

因为有公共左因子的问题，公共左公因子是指在文法的产生式集合中，某个非终结符的多个候选式具有相同的前缀。
一般来说，公共左公因子的产生式为
$A \to α β_{1} │ α β_{2}$
如果有公共左因子的问题，那么只能采取试探的方法来分析每一个候选式，分析的过程很可能产生回溯，回溯分析法是一种不确定的方法。
若所有候选式都没有公共左因子就可以选择惟一匹配的候选式，不会产生(公共左公因子引起的)回溯。
为了消除回溯，对任何一个非终结符和当前的待匹配符号，期望
- 要么只有一个候选式可用
- 要么没有候选式可用

因此引入以下FIRST集合的概念:

对 $α \in (V_{T} ⋃ V_{N})^{*}$ ,有
$F I R S T (α) ＝ {a | α \overset{*}{⟹} a \cdot \cdot \cdot, a \in V_{T}}$
特别地，若 $α \overset{*}{⟹} ε$ ,则 $ε \in F I R S T (α)$

因此对于每一文法符号 $X \in V_{T} ⋃ V_{N}$ ，构造 $F I R S T (X)$ 的方法为:
使用下列规则，直至每个FIRST集不再增大为止：

若 $X \in V_{T}$ ，则 $F I R S T (X) = {X}$ (意思是如果 $X$ 是终结符，则其 $F I R S T$ 集合为其自身)；
若 $X \in V_{N}$ ，那么 $X$ 的产生式分以下三种情况:
- $X \to ε$
- 则 $ε \in F I R S T (X)$
- $X \to a \cdot \cdot \cdot$
- 则 $a \in F I R S T (X)$
- $X \to Y \cdot \cdot \cdot$ ，且 $Y \in V_{N}$
- 则 $F I R S T (Y) - {ε} \subseteq F I R S T (X)$
- 特例: $X \to Y_{1} Y_{2} \cdot \cdot \cdot Y_{i - 1} Y_{i} \cdot \cdot \cdot Y_{k}$
  且 $Y_{1}, Y_{2}, \cdot \cdot \cdot Y_{i - 1} \in V_{N}$
  $Y_{1}, Y_{2}, \cdot \cdot \cdot Y_{i - 1} \overset{*}{⟹} ε$
  - 则 $F I R S T (Y_{j}) - {ε} \subseteq F I R S T (X) (1 \leq j \leq i - 1) ， F I R S T (Y_{i}) \subseteq F I R S T (X)$
- 特别地，当 $Y_{1} Y_{2} \cdot \cdot \cdot Y_{i - 1} Y_{i} \cdot \cdot \cdot Y_{k} \overset{*}{⟹} ε$
  - 则 $ε \in F I R S T (X)$

结论:针对无空产生式的文法G，同一非终结符的任两个产生式的右部符号串的FIRST集无交集，即可进行确定的自顶向下分析。

2.为什么要引入FOLLOW集的概念？

考虑文法G[S]:
$S \to a A$
$S \to d$
$A \to b A S$
$A \to ε$
求得各终结符和符号串的FIRST集合如下:
$F I R S T (S) = {a, d}$
$F I R S T (A) = {b, ε}$
$F I R S T (a A) = {a}$
$F I R S T (d) = {d}$
$F I R S T (b A S) = {b}$
$F I R S T (ε) = {ε}$
若输入串 $W = a b d$ ，则试图推导出abd串的推导过程为 $S \Rightarrow a A \Rightarrow a b A S \Rightarrow a b S \Rightarrow a b d$
从以上推导过程中可以看到，在第2步到第3步的推导中，即 $a b A S \Rightarrow a b S$ 时，因为当前面临的输入符号为 $d$ ，但是最左非终结符 $A$ 的产生式右部的开始符号集都不包含 $d$ ，但有 $ε$ ，因此对于 $d$ 的匹配自然认为只能依赖于在可能的推导过程中 $A$ 的后面的符号，所以这时候选用产生式 $A \to ε$ 向下推导。而当前 $A$ 后面的符号为 $S$ ， $S$ 产生式右部的开始符号集包含了 $d$ ，所以例子中可用 $S \to d$ 推导得到匹配。
语法树如下所示:
这里写图片描述
很显然，我们从以上叙述中可以得出:
当某一非终结符的产生式中含有空产生式时，它的非空产生式右部的开始符号集两两不相交，并与在推导过程中紧跟该非终结符右部可能出现的终结符集也不相交，则仍可构造确定的自顶向下分析。因此，引入了一个文法符号的后跟符号集合。
引入以下FOLLOW集的概念:

对 $A \in V_{N}$ ，有
$F O L L O W (A) = {a | S \overset{*}{⟹} \cdot \cdot \cdot A a \cdot \cdot \cdot ， a \in V_{T}}$
若 $S \overset{*}{⟹} \cdot \cdot \cdot A$ ，则规定 $# \in F O L L O W (A)$
这里用#作为输入串的结束符，也称为输入串括号。

因此对于每一文法符号 $A \in V_{N}$ ，实际上求 $F O L L O W (A)$
就是考察A在产生式右端的出现情况，哪些终结符号可以跟随在A后面？

使用下列规则，直至每个FOLLOW集不再增大为止：

首先，设S为文法的开始符号，把 ${#}$ 加入 $F O L L O W (S)$ 中(这里#为句子括号)
若 $B \to α A β$ 是一个产生式，则 $F I R S T (β) - {ε} \subseteq F O L L O W (A)$
如果或者且，则
- 解释: 因为在推导过程中可能出现如下的句型序列:
- $S \overset{*}{\Rightarrow} \cdot \cdot \cdot α_{1} B β_{1} \cdot \cdot \cdot \Rightarrow \cdot \cdot \cdot α_{1} α A β β_{1} \cdot \cdot \cdot \Rightarrow \cdot \cdot \cdot α_{1} α A β_{1} \cdot \cdot \cdot$

非终结符	FIRST	FOLLOW
A	{a, b, c, d, g}	{f, #}
B	{b, $ε$ }	{a, c, d, g, f, #}
C	{a, c, d}	{c, d, g}
D	{d, $ε$ }	{a, b, c, g, f, #}
E	{c, g}	{a, c, d, g, f, #}

对于FIRST集合，解释其中的FIRST(A)的求解。

$A \to B C c$ 属于上述产生式的特例情况，很显然 $B \overset{*}{\Rightarrow} ε ， C \overset{*}{⇏} ε$ ，因此
$(F I R S T (B) - {ε}) ⋃ F I R S T (C) \subseteq F I R S T (A)$
$A \to g D B$ 属于上述产生式的第二种情况，因此 $g \in F I R S T (A)$
最后得出:
$F I R S T (A) = (F I R S T (B) - {ε}) ⋃ F I R S T (C) ⋃ {g}$
而 $F I R S T (B) = {b, ε} ， F I R S T (C) = {a, c, d}$
故 $F I R S T (A) = {a, b, c, d, g}$

对于FOLLOW集合，有如下的计算情况:

\begin{aligned} F O L L O W (A) = (F I R S T (f) - {ε}) ⋃ {#} = {f, #} \end{aligned}

\begin{aligned} F O L L O W (B) & = (F I R S T (C c) - {ε}) ⋃ F O L L O W (A) ⋃ F O L L O W (C) \\ = {a, c, d} ⋃ {f, #} ⋃ F O L L O W (C) \\ = {a, c, d} ⋃ {f, #} ⋃ {c, d, g} \\ = {a, c, d, g, f, #} \end{aligned}

\begin{aligned} F O L L O W (C) & = (F I R S T (c) - {ε}) ⋃ (F I R S T (D E) - {ε}) \\ = {c} ⋃ (F I R S T (D) - {ε}) ⋃ F I R S T (E) \\ = {c, d, g} \end{aligned}

\begin{aligned} F O L L O W (D) & = (F I R S T (B) - {ε}) ⋃ F O L L O W (A) ⋃ (F I R S T (E) - {ε}) ⋃ (F I R S T (a B) - {ε}) \\ = {b} ⋃ {f, #} ⋃ {c, g} ⋃ {a} \\ = {a, b, c, g, f, #} \end{aligned}

\begin{aligned} F O L L O W (E) & = F O L L O W (B) \\ = {a, c, d, g, f, #} \end{aligned}

3.为什么要引入SELECT集的概念？

由于从2中我们得出结论:
当某一非终结符的产生式中含有空产生式时，它的非空产生式右部的开始符号集两两不相交，并与在推导过程中紧跟该非终结符右部可能出现的终结符集也不相交，则仍可构造确定的自顶向下分析。
因此当文法中含有形如：

A \to α A \to β

的产生式时，其中

A \in V_{N}, α 、 β \in V^{*}

，若

α

和

β

不能同时推导出空，假定

α \overset{*}{⇏} ε ， β \overset{*}{\Rightarrow} ε

，则当

F I R S T (α) ⋂ F O L L O W (A) = \emptyset F I R S T (β) ⋂ F O L L O W (A) = \emptyset

也即是

F I R S T (α) ⋂ (F I R S T (β) ⋃ F O L L O W (A)) = \emptyset

时，对于非终结符A的替换仍可唯一地确定候选。为了表示和分析方便，因此引入了SELECT集合。
SELECT集合定义如下：

一个产生式的选择符号集SELECT。给定上下文无关文法的产生式 $A \to α, A \in V_{N}, α \in V^{*}$ ，若 $α \overset{*}{⇏} ε$ ，则 $S E L E C T (A \to α) = F I R S T (α)$ 。
如果 $α \overset{*}{\Rightarrow} ε$ ，则 $S E L E C T (A \to α) = (F I R S T (α) - {ε}) ⋃ F O L L O W (A)$ 。

因此一个上下文无关文法是LL(1)文法的充分必要条件是，对每个非终结符A的两个不同产生式， $A \to α ， A \to β$ ，满足

S E L E C T (A \to α) ⋂ S E L E C T (A \to β) = \emptyset

其中

α 、 β

不同时能

\overset{*}{\Rightarrow} ε

。

再次回到上述例题

非终结符	FIRST	FOLLOW
A	{a, b, c, d, g}	{f, #}
B	{b, $ε$ }	{a, c, d, g, f, #}
C	{a, c, d}	{c, d, g}
D	{d, $ε$ }	{a, b, c, g, f, #}
E	{c, g}	{a, c, d, g, f, #}

右部产生式	FIRST
BCc	{a, b, c, d}
gDB	{ g }
bCDE	{ b }
$ε$	{ $ε$ }
DaB	{a, d}
ca	{ c }
dD	{ d }
gAf	{ g }
c	{ c }

因此根据以上所求得的FIRST集和FOLLOW集，可求得各产生式的SELECT集合如下：

\begin{aligned} S E L E C T (A \to B C c) = {a, b, c, d} \\ S E L E C T (A \to g D B) = {g} \\ S E L E C T (B \to b C D E) = {b} \\ S E L E C T (B \to ε) = {a, c, d, g, f, #} \\ S E L E C T (C \to D a B) = {a, d} \\ S E L E C T (C \to c a) = {c} \\ S E L E C T (D \to d D) = {d} \\ S E L E C T (D \to ε) = {a, b, c, g, f, #} \\ S E L E C T (E \to g A f) = {g} \\ S E L E C T (E \to c) = {c} \end{aligned}

由上可知，有相同左部产生式的SELECT集合的交集为空，所以文法是LL(1)文法。

编译原理FIRST、FOLLOW、SELECT集の通俗解释

1.为什么要引入FIRST集的概念？

2.为什么要引入FOLLOW集的概念？

3.为什么要引入SELECT集的概念？

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

编译原理FIRST、FOLLOW、SELECT集の通俗解释

1.为什么要引入FIRST集的概念？

2.为什么要引入FOLLOW集的概念？

3.为什么要引入SELECT集的概念？

热门文章

最新文章

相关电子书