Shell中的IFS解惑

简介: 一、IFS 介绍     Shell 脚本中有个变量叫 IFS(Internal Field Seprator) ,内部域分隔符。

一、IFS 介绍

    Shell 脚本中有个变量叫 IFS(Internal Field Seprator) ,内部域分隔符。完整定义是The shell uses the value stored in IFS, which is the space, tab, and newline characters  by default, to delimit words for the read and set commands, when parsing output from command substitution, and when performing variable substitution.

    Shell 的环境变量分为 set, env 两种,其中 set 变量可以通过 export 工具导入到 env 变量中。其中,set 是显示设置shell变量,仅在本 shell 中有效;env 是显示设置用户环境变量 ,仅在当前会话中有效。换句话说,set 变量里包含了 env 变量,但 set 变量不一定都是 env 变量。这两种变量不同之处在于变量的作用域不同。显然,env 变量的作用域要大些,它可以在 subshell 中使用。

    而 IFS 是一种 set 变量,当 shell 处理"命令替换"和"参数替换"时,shell 根据 IFS 的值,默认是 space, tab, newline 来拆解读入的变量,然后对特殊字符进行处理,最后重新组合赋值给该变量。

二、IFS 简单实例

1、查看变量 IFS 的值。

[plain] view  plaincopyprint?

  1. $ echo $IFS  
  2.  
  3. $ echo "$IFS" | od -b  
  4. 0000000 040 011 012 012  
  5. 0000004  

直接输出IFS是看不到的,把它转化为二进制就可以看到了,"040"是空格,"011"是Tab,"012"是换行符"\n" 。最后一个 012 是因为 echo 默认是会换行的。

2、$* 和 $@ 的细微差别
    从下面的例子中可以看出,如果是用冒号引起来,表示这个变量不用IFS替换!!所以可以看到这个变量的"原始值"。反之,如果不加引号,输出时会根据IFS的值来分割后合并输出! $* 是按照IFS中的第一个值来确定的!下面这两个例子还有细微的差别!

[plain] view  plaincopyprint?

  1. $ IFS=:;  
  2. $ set x y z  
  3. $ echo $*  
  4. x y z  
  5. $ echo "$*"  
  6. x:y:z  
  7. $ echo $@  
  8. x y z  
  9. $ echo "$@"  
  10. x y z  

上例 set 变量其实是3个参数,而下面这个例子实质是2个参数,即 set "x y z"  和 set x y z 是完全不同的。

[plain] view  plaincopyprint?

  1. $ set "x" "y z"  
  2. $ echo $*  
  3. x y z  
  4. $ echo "$*"  
  5. x:y z  
  6. $ echo $@  
  7. x y z  
  8. $ echo "$@"  
  9. x y z  
  10. $ echo $* |od -b  
  11. 0000000 170 040 171 040 172 012  
  12. 0000006  
  13. $ echo "$*" |od -b  
  14. 0000000 170 072 171 040 172 012  
  15. 0000006  

小结:$* 会根据 IFS 的不同来组合值,而 $@ 则会将值用" "来组合值!

3、for 循环中的奇怪现象

[plain] view  plaincopyprint?

  1. $ for x in $var ;do echo $x |od -b ;done  
  2. 0000000 012  
  3. 0000001  
  4. 0000000 040 141 012  
  5. 0000003  
  6. 0000000 142 012  
  7. 0000002  
  8. 0000000 012  
  9. 0000001  
  10. 0000000 143 012  
  11. 0000002  

先暂且不解释 for 循环的内容!看下面这个输出!IFS 的值同上! var=": a:b::c:"

[plain] view  plaincopyprint?

  1. $ echo $var |od -b  
  2. 0000000 040 040 141 040 142 040 040 143 012  
  3. 0000011  
  4. $ echo "$var" |od -b  
  5. 0000000 072 040 141 072 142 072 072 143 072 012  
  6. 0000012  

"$var"的值应该没做替换,所以还是 ": a:b::c:" (注 "072" 表示冒号),但是$var 则发生了变化!注意输出的最后一个冒号没有了,也没有替换为空格!Why?

使用 $var 时是经历了这样一个过程!首先,按照这样的规则 [变量][IFS][变量][IFS]……根据原始 var 值中所有的分割符(此处是":")划分出变量,如果IFS的值是有多个字符组成,如IFS=":;",那么此处的[IFS]指的是IFS中的任意一个字符($* 是按第一个字符来分隔!),如 ":" 或者 ";" ,后面不再对[IFS]做类似说明!(注:[IFS]会有多个值,多亏 #blackold 的提醒);然后,得到类似这样的  list, ""   " a"   "b"  ""   "c"  。如果此时 echo $var,则需要在这些变量之间用空格隔开,也就是""  [space]   "  a"  [space]  "b" [space]  "" [space]  "c" ,忽略掉空值,最终输出是 [space][space]a[space]b[space][space]c

如果最后一个字符不是分隔符,如 var="a:b",那么最后一个分隔符后的变量就是最后一个变量!

这个地方要注意下!!如果IFS就是空格,那么类似于" [space][space]a[space]b[space][space]c "会合并重复的部分,且去头空格,去尾空格,那么最终输出会变成类似 a[space]b[space]c ,所以,如果IFS是默认值,那么处理的结果就很好算出来,直接合并、忽略多余空格即可!

另外,$* 和 $@ 在函数中的处理过程是这样的(只考虑"原始值"!)!"$@",就是像上面处理后赋值,但是 "$*" 却不一样!它的值是用分隔符(如":")而不是空格隔开!具体例子见最后一个例子!

好了,现在来解释 for 循环的内容。for 循环遍历上面这个列表就可以了,所以 for 循环的第一个输出是空!("012"是echo输出的换行符 )。。。。后面的依次类推!不信可以试试下面这个例子,结果是一样的!

[plain] view  plaincopyprint?

  1. $ for x in "" " a" "b" "" "c" ;do echo $x |od -b ;done  
  2. 0000000 012  
  3. 0000001  
  4. 0000000 040 141 012  
  5. 0000003  
  6. 0000000 012  
  7. 0000001  
  8. 0000000 142 012  
  9. 0000002  
  10. 0000000 012  
  11. 0000001  
  12. 0000000 143 012  
  13. 0000002  

三、IFS的其他实例

Example 1:

[plain] view  plaincopyprint?

  1. $ IFS=:  
  2. $ var=ab::cd  
  3. $ echo $var  
  4. ab  cd  
  5. $ echo "$var"  
  6. ab::cd  

解释下:x 的值是 "ab::cd",当进行到 echo $x 时,因为$符,所以会进行变量替换。Shell 根据 IFS 的值将 x 分解为 ab "" cd,然后echo,插入空隔,ab[space]""[space]cd,忽略"",输出  ab  cd

Example 2 :

[plain] view  plaincopyprint?

  1. $ read a  
  2.       xy  z  
  3. $ echo $a  
  4. xy  z  

解释:这是 http://bbs.chinaunix.net/thread-207178-1-1.html 上的一个例子。此时IFS是默认值,本希望把所有的输入(包括空格)都放入变量a中,但是输出的a却把前面的空格给忽略了!!原因是:默认的 IFS 会按 space  tab newline 来分割。这里需要注意的一点是,read 命令的实现过程,即在读入时已经替换了。解决办法是在开头加上一句 IFS=";" ,这里必须加上双引号,因为分号有特殊含义。

Example 3 :

[plain] view  plaincopyprint?

  1. $ tmp="   xy z"  
  2. $ a=$tmp  
  3. $ echo $a  
  4. $ echo "$a"  

解释:什么时候会根据 IFS 来"处理"呢?我觉得是,对于不加引号的变量,使用时都会参考IFS,但是要注意其原始值!

Example 4 :

[plain] view  plaincopyprint?

  1. #!/bin/bash  
  2. IFS_old=$IFS      #将原IFS值保存,以便用完后恢复  
  3. IFS=$’\n’        #更改IFS值为$’\n’ ,注意,以回车做为分隔符,IFS必须为:$’\n’  
  4. for i in $((cat pwd.txt)) #pwd.txt 来自这个命令:cat /etc/passwd >pwd.txt  
  5. do  
  6.    echo $i  
  7. done  
  8. IFS=$IFS_old      #恢复原IFS值  

另外一个例子,把IP地址逆转输出:

Example 5 :

[plain] view  plaincopyprint?

  1. #!/bin/bash  
  2.  
  3. IP=220.112.253.111  
  4. IFS="."  
  5. TMPIP=$(echo $IP)  
  6. IFS=" " # space  
  7. echo $TMPIP  
  8. for x in $TMPIP ;do  
  9.    Xip="${x}.$Xip"  
  10. done  
  11. echo ${Xip%.}  

Complex_Example 1:  http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=3660898&page=1#pid21798049

[plain] view  plaincopyprint?

  1. function output_args_ifs(){  
  2.    echo "=$*"  
  3.    echo "="$*  
  4.    for m in $* ;do  
  5.        echo "[$m]"  
  6.    done  
  7. }  
  8.  
  9. IFS=':'  
  10. var='::a:b::c:::'  
  11. output_args_ifs $var  

输出为:

[plain] view  plaincopyprint?

  1. =::a:b::c::  # 少了最后一个冒号!看前面就知道为什么了  
  2. =  a b  c  
  3. []  
  4. []  
  5. [a]  
  6. [b]  
  7. []  
  8. [c]  
  9. []  

由于 "output_args_ifs $var" 中 $var 没有加引号,所以根据IFS替换!根据IFS划分出变量: ""  ""  "a"  "b"  ""  "c" "" ""(可以通过输出 $# 来测试参数的个数!),重组的结果为

"$@" 的值是  "" [space] "" [space]  "a" [space]  "b"  [space] "" [space]  "c" [space] "" [space] "",可以通过,echo==>"  a b  c   "
"$*" 的值是   "" [IFS] "" [IFS]  "a" [IFS]  "b"  [IFS] "" [IFS]  "c" [IFS] "" [IFS] "",忽略"",echo=>"::a:b::c::"

注意, $* 和 $@ 的值都是  ""   ""   "a"   "b"   ""   "c"  ""  "" 。可以说是一个列表……因为他们本来就是由 $1 $2 $3……组成的。

所以,《Linux程序设计》里推荐使用 $@,而不是$*

总结:IFS 其实还是很麻烦的,稍有不慎就会产生很奇怪的结果,因此使用的时候要注意!我也走了不少弯路,只希望能给后来者一些帮助。本文若有问题,欢迎指正!!谢谢!


参考:
http://blog.chinaunix.net/space.php?uid=20543672&do=blog&id=94358
http://smilejay.com/2011/12/bash_ifs/#comment-51
(全文完)

目录
相关文章
|
Shell Linux Perl
|
Shell
shell中for循环变量有空格的问题——IFS变量
shell中for循环变量有空格的问题——IFS变量
493 0
|
Shell Linux
linux shell之IFS分割字符串
linux shell之IFS分割字符串
311 0
|
2月前
|
Shell
一个用于添加/删除定时任务的shell脚本
一个用于添加/删除定时任务的shell脚本
114 1
|
1月前
|
Shell Linux 测试技术
6种方法打造出色的Shell脚本
6种方法打造出色的Shell脚本
66 2
6种方法打造出色的Shell脚本
|
1月前
|
XML JSON 监控
Shell脚本要点和难点以及具体应用和优缺点介绍
Shell脚本在系统管理和自动化任务中扮演着重要角色。尽管存在调试困难、可读性差等问题,但其简洁高效、易于学习和强大的功能使其在许多场景中不可或缺。通过掌握Shell脚本的基本语法、常用命令和函数,并了解其优缺点,开发者可以编写出高效的脚本来完成各种任务,提高工作效率。希望本文能为您在Shell脚本编写和应用中提供有价值的参考和指导。
61 1
|
1月前
|
Ubuntu Shell 开发工具
ubuntu/debian shell 脚本自动配置 gitea git 仓库
这是一个自动配置 Gitea Git 仓库的 Shell 脚本,支持 Ubuntu 20+ 和 Debian 12+ 系统。脚本会创建必要的目录、下载并安装 Gitea,创建 Gitea 用户和服务,确保 Gitea 在系统启动时自动运行。用户可以选择从官方或小绿叶技术博客下载安装包。
51 2
|
2月前
|
监控 网络协议 Shell
ip和ip网段攻击拦截系统-绿叶结界防火墙系统shell脚本
这是一个名为“小绿叶技术博客扫段攻击拦截系统”的Bash脚本,用于监控和拦截TCP攻击。通过抓取网络数据包监控可疑IP,并利用iptables和firewalld防火墙规则对这些IP进行拦截。同时,该系统能够查询数据库中的白名单,确保合法IP不受影响。此外,它还具备日志记录功能,以便于后续分析和审计。
58 6
下一篇
DataWorks