Linux笔记丨三剑客是谁?grep、sed、awk

简介: Linux笔记丨三剑客是谁?grep、sed、awk

今天分享的学习笔记内容是Linux三剑客,包括grep、sed、awk命令的基础知识,以及一些正则表达式相关内容。

正则表达式是对字符串和特殊字符操作的一种逻辑公式,就是用事先定义好的一些特定字符及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个规则的文本,sed、awk、grep命令能够实现这种功能。


文本搜索grep函数

grep是一个文本搜索工具,支持正则表达式,能够把匹配的行显示出来。egrep是扩展版支持更多元字符,笔记里提到的为grep。语法格式如下:

grep '条件' file.name -x(参数)

命令常见参数选项(-x):

  • i:忽略大小写
  • v:输出反转结果
  • x:精确匹配整行内容
  • -color:高亮显示匹配行
  • n:输出同时显示行号
  • c:计算符合样式的行数
  • q:不显示任何信息

简单示例

grep '^abc' xx.txt
输出以abc开头的行
grep '[0-9]' xx.txt
输出包含数字的行
grep '^$' xx.txt
输出空行
grep 'xyz$' xx.txt
输出以xyz结尾的行
grep 'a*c' xx.txt
输出a开头c结尾的行

文本处理awk函数

awk最基本的功能是基于指定规则浏览和抽取信息,awk抽取信息后,才能进行其他文本操作,完整的awk脚本通常用来格式化文本文件中的信息。通常,awk是以文件的一行为处理单位。语法格式如下:

awk '{pattern + action}'{filenames}
awk 'BEGIN{OFS=FS="\t"}{print $0, $1;}' filename
awk 'BEGIN{OFS=FS="\t"}ARGIND==1{print $0, $1;}ARGIND==2{print $0;}' file1 file2

awk运算符:awk内置变量:

常见参数解释

  • OFS:输出时列分隔符
  • FS:输入时列分隔符
  • $0:第一行
  • $1\$2\$NF:第一列、第二列、最后一列
  • NF:总列数
  • NR:总行数
  • FNR:当前读取了多少行
  • F:指定分隔符

实例演示

  • 输出20到30行的内容
awk '{if(NR>=20 && NR<=30) print $1}' test.txt

文本替换sed函数

sed一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。这样不断重复,直到文件末尾。

  • 语法格式为:
sed [-nefri等参数] ‘command’ 输入文本 
sed -i 's/被替换的内容/要替换成的内容/' file
sed 's/被替换的内容/要替换成的内容/g' file > file.out
  • n∶安静模式。只有经过sed 特殊处理的那一行才会被列出来。
  • e∶直接在指令列模式上进行 sed 的动作编辑;
  • f∶直接将 sed 的动作写在一个档案内,
  • r∶sed 延伸型正则表示法的语法。(预设是基础正则表示法语法)
  • i∶直接修改读取的档案内容,而不是输出。

实例展示

删除文件第3行
sed '3d' xxx.txt
删除文件最后一行
sed "$d" xxx.txt
删除空格
sed ’s/^[ ]*//g’ xxx.txt
替换:把test替换为mytest。如果没有g标记,则只有每行第一个匹配的test被替换成mytest。
sed 's/test/mytest/g' xxx.txt
添加新行(向前)
sed ‘s/pattern/&\n/g’ filename
在最后一行插入字符
sed -i ‘$ a\插入字符串’ filename

参考资料

https://www.cnblogs.com/ginvip/p/6352157.html 

https://baike.baidu.com
http://www.ehbio.com/Bioinfo_bash_course/


END

© 素材来源于网络,侵权请联系后台删除

往期推荐:

软件丨MobaXterm远程登录工具

软件丨个人电脑搭建Linux虚拟机

文献丨转录组RNA seq——青年阶段!

文献丨转录组表达数据的生信挖掘研究

R语言笔记丨字符串和列表必学基础知识

R语言笔记丨三大法宝:判断、循环、函数

相关实践学习
CentOS 7迁移Anolis OS 7
龙蜥操作系统Anolis OS的体验。Anolis OS 7生态上和依赖管理上保持跟CentOS 7.x兼容,一键式迁移脚本centos2anolis.py。本文为您介绍如何通过AOMS迁移工具实现CentOS 7.x到Anolis OS 7的迁移。
相关文章
|
5天前
|
监控 Linux
linux之grep详解
linux之grep详解
|
6天前
|
Linux Perl
Linux之sed命令
Linux之sed命令
|
15天前
|
存储 Linux Shell
linux查找技巧: find grep xargs
linux查找技巧: find grep xargs
26 13
|
8天前
|
人工智能 监控 Shell
常用的 55 个 Linux Shell 脚本(包括基础案例、文件操作、实用工具、图形化、sed、gawk)
这篇文章提供了55个常用的Linux Shell脚本实例,涵盖基础案例、文件操作、实用工具、图形化界面及sed、gawk的使用。
25 2
|
15天前
|
机器学习/深度学习 存储 Linux
linux中强大且常用命令:find、xargs、grep
linux中强大且常用命令:find、xargs、grep
32 9
|
15天前
|
SQL 移动开发 Linux
linux下find、grep命令详解
linux下find、grep命令详解
122 8
|
6天前
|
Linux Perl
6-20|linux sed命令
6-20|linux sed命令
|
5月前
|
搜索推荐 Linux 开发工具
【Linux】深入理解awk命令
【Linux】深入理解awk命令
68 0
|
11月前
|
存储 Linux Shell
Linux awk命令
除了使用 sed 命令,Linux 系统中还有一个功能更加强大的文本数据处理工具,就是 awk。 曾有人推测 awk 命令的名字来源于 awkward 这个单词。其实不然,此命令的设计者有 3 位,他们的姓分别是 Aho、Weingberger 和 Kernighan,awk 就取自这 3 为大师姓的首字母。 和 sed 命令类似,awk 命令也是逐行扫描文件(从第 1 行到最后一行),寻找含有目标文本的行,如果匹配成功,则会在该行上执行用户想要的操作;反之,则不对行做任何处理。awk 命令的基本格式为: [root@localhost ~]# awk [选项] '脚本命令' 文件名
96 1
|
12月前
|
Unix 测试技术 Linux
软件测试|Linux三剑客之awk命令详解
软件测试|Linux三剑客之awk命令详解
85 0
下一篇
无影云桌面