Linux命令解析过程
本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:
命令解析过程将命令行分成由固定元字符集分隔的记号:SPACE, TAB, NEWLINE, ; , (, ), , |, &,记号类型包括单词,关键字,I/O重定向符和分号。
命令解析过程
- 将命令行分成由固定元字符集分隔的记号:SPACE, TAB, NEWLINE, ; , (, ), <, >, |, &,记号类型包括单词,关键字,I/O重定向符和分号。
- 检测每个命令的第一个记号,查看是否为不带引号或反斜线的关键字。如果是一个开放的关键字,如if和其他控制结构起始字符串,function,{或(,则命令实际上为一复合命令。shell在内部对复合命令进行处理,读取下一个命令,并重复这一过程。如果关键字不是复合命令起始字符串(如then等一个控制结构中间出现的关键字),则给出语法错误信号。
- 依据别名列表检查每个命令的第一个关键字。如果找到相应匹配,则替换其别名定义,并退回第一步;否则进入第4步。该策略允许递归别名,还允许定义关键字别名。如alias procedure=function
- 执行大括号扩展,例如a{b,c}变成ab ac
- 如果~位于单词开头,用$HOME替换~。使用usr的主目录替换~user。
- 对任何以符号$开头的表达式执行参数(变量)替换
- 对形式$(string)的表达式进行命令替换
- 计算形式为$((string))的算术表达式
- 把行的参数,命令和算术替换部分再次分成单词,这次它使用$IFS中的字符做分割符而不是步骤1的元字符集。
- 对出现*, ?, [ / ]对执行路径名扩展,也称为通配符扩展
- 按命令优先级表(跳过别名),进行命令查寻
- 设置完I/O重定向和其他操作后执行该命令。
引号处理
- 单引号跳过了前10个步骤,不能在单引号里放单引号
- 双引号跳过了步骤1~5,步骤9~10,也就是说,只处理6~8个步骤。
也就是说,双引号忽略了管道字符,别名,~替换,通配符扩展,和通过分隔符分裂成单词。双引号里的单引号没有作用,但双引号允许参数替换,命令替换和算术表达式求值。可以在双引号里包含双引号,方式是加上转义符”\”,还必须转义$, `, \。
特殊字符
常见元字符
字符 |
说明 |
IFS |
由 或 或 三者之一组成(我们常用 space )。 |
CR |
由 产生。 |
= |
设定变量。 |
$ |
作变量或运算替换(请不要与 shell prompt 搞混了)。 |
> |
重导向 stdout。 * |
< |
重导向 stdin。 * |
|
|
& |
重导向 file descriptor ,或将命令置于背境执行。 * |
( ) |
将其内的命令置于 nested subshell 执行,或用于运算或命令替换。 * |
{ } |
将其内的命令置于 non-named function 中执行,或用在变量替换的界定范围。 |
; |
在前一个命令结束时,而忽略其返回值,继续执行下一个命令。 * |
&& |
在前一个命令结束时,若返回值为 true,继续执行下一个命令。 * |
|
|
! |
执行 history 列表中的命令。* |
常用通配符
字符 |
含义 |
实例 |
* |
匹配 0 或多个字符 |
a*b a与b之间可以有任意长度的任意字符, 也可以一个也没有, 如aabcb, axyzb, a012b, ab。 |
? |
匹配任意一个字符 |
a?b a与b之间必须也只能有一个字符, 可以是任意字符, 如aab, abb, acb, a0b。 |
[list] |
匹配 list 中的任意单一字符 |
a[xyz]b a与b之间必须也只能有一个字符, 但只能是 x 或 y 或 z, 如: axb, ayb, azb。 |
[!list] |
匹配 除list 中的任意单一字符 |
a[!0-9]b a与b之间必须也只能有一个字符, 但不能是阿拉伯数字, 如axb, aab, a-b。 |
[c1-c2] |
匹配 c1-c2 中的任意单一字符 如:[0-9] [a-z] |
a[0-9]b 0与9之间必须也只能有一个字符 如a0b, a1b… a9b。 |
{string1,string2,…} |
匹配 sring1 或 string2 (或更多)其一字符串 |
a{abc,xyz,123}b a与b之间只能是abc或xyz或123这三个字符串之一。 |
转义字符
符号 |
意义 |
‘’(单引号) |
又叫硬转义,其内部所有的shell 元字符、通配符都会被关掉。注意,硬转义中不允许出现’(单引号)。 |
“”(双引号) |
又叫软转义,其内部只允许出现特定的shell 元字符:$用于参数代换 `用于命令代替 |
(反斜杠) |
又叫转义,去除其后紧跟的元字符或通配符的特殊意义。 |