Linux|Awk 特定模式 过滤 文本

简介: Linux|Awk 特定模式 过滤 文本

以下部分中,我们将研究基于用户可以定义的特定模式过滤文本或字符串。

有时,在过滤文本时,您希望根据给定条件或使用可匹配的特定模式来指示输入文件中的某些行或字符串行。使用 Awk 执行此操作非常简单,这是 Awk 的强大功能之一,您会发现它很有帮助。

示例

让我们看一下下面的示例,假设您有一个想要购买的食品的购物清单,名为 food_prices.list。

它有以下食品及其价格清单。

cat food_prices.list 
No    Item_Name        Quantity    Price
1    Mangoes               10        $2.45
2    Apples               20        $1.50
3    Bananas               5        $0.90
4    Pineapples           10        $3.46
5    Oranges               10        $0.78
6    Tomatoes           5        $0.55
7    Onions               5            $0.45

然后,您想在价格大于 2 美元的食品上标明 (*) 符号,可以通过运行以下命令来完成:

awk '/ *$[2-9]\.[0-9][0-9] */ { print $1, $2, $3, $4, "*" ; } / *$[0-1]\.[0-9][0-9] */ { print ; }' food_prices.list

从上面的输出中,您可以看到包含食品、芒果和菠萝的行末尾有一个 (*) 符号。如果你检查一下他们的价格,它们都在 2 美元以上。

在此示例中,我们使用了两种模式:

  • 第一个: / \$[2-9].[0-9][0-9] / 获取食品价格大于 2 美元的行
  • 第二个: /\$[0-1].[0-9][0-9] */ 查找食品价格低于 2 美元的行。

文件中有四个字段,当一遇到食品价格大于 2 美元的行时,它会打印所有四个字段并在行末尾打印一个 ( * ) 符号作为标志。

第二种模式只是打印输入文件 food_prices.list 中食品价格低于 2 美元的其他行。

通过这种方式,您可以使用特定于模式的操作来过滤掉价格高于 2 美元的食品,尽管输出存在问题,但带有 (*) 符号的行的格式不会像其余行那样进行格式化。输出不够清晰。

可以通过两种方式解决它:

  1. 使用 printf 命令,这是一种漫长而无聊的方法,使用以下命令:
$ awk '/ *$[2-9]\.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s\n", $1, $2, $3, $4 "*" ; } / *$[0-1]\.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s\n", $1, $2, $3, $4; }' food_prices.list

  1. 使用 $0 字段。 awk 使用变量 0 来存储整个输入行。这对于解决上述问题很方便,而且简单快捷,如下所示:
$ awk '/ *$[2-9]\.[0-9][0-9] */ { print $0 "*" ; } / *$[0-1]\.[0-9][0-9] */ { print ; }' food_prices.list

总结

这些是使用特定模式的操作来过滤文本的简单方法,可以帮助使用 Awk 命令标记文件中的文本行或字符串。

未完待续,欢迎关注!

相关文章
|
9天前
|
Linux Perl
Linux|从 STDIN 读取 Awk 输入
Linux|从 STDIN 读取 Awk 输入
25 4
|
9天前
|
Linux Perl
Linux技巧|Awk 比较运算符
在 Awk 中,使用比较运算符(如 >, <, ==, != 等)可方便地过滤文本和字符串。本文通过示例展示了如何处理食品购物清单,标记数量小于或等于 20 的商品。 Awk 语法 `expression { actions; }` 用于根据条件执行操作,如在满足条件的行末尾添加特殊标记。例如,`$3 <= 20 { printf "%s\t%s\n", $0,"TRUE" ; }` 会在数量小于或等于 20 的行后添加 "TRUE"。继续探索 Awk 的比较运算符以进行更复杂的文本处理。
29 2
|
3天前
|
存储 Linux Shell
Linux|如何在 awk 中使用流控制语句
Linux|如何在 awk 中使用流控制语句
13 1
|
9天前
|
Shell Linux Perl
Linux|如何允许 awk 使用 Shell 变量
Linux|如何允许 awk 使用 Shell 变量
19 2
|
9天前
|
Linux Perl
Linux|了解如何使用 awk 内置变量
Linux|了解如何使用 awk 内置变量
15 1
|
9天前
|
Linux 开发工具 Perl
|
9天前
|
Linux Shell 开发工具
【Linux】:文本编辑与输出命令 轻松上手nano、echo和cat
【Linux】:文本编辑与输出命令 轻松上手nano、echo和cat
26 0
|
9天前
|
Linux Shell Perl
Linux | awk 特殊模式“BEGIN 和 END”
Linux | awk 特殊模式“BEGIN 和 END”
24 2
|
9天前
|
Rust 监控 安全
【专栏】`ripgrep`(rg)是Linux下快速、内存高效的文本搜索工具,用Rust编写,支持PCRE2正则表达式
【4月更文挑战第28天】`ripgrep`(rg)是Linux下快速、内存高效的文本搜索工具,用Rust编写,支持PCRE2正则表达式。相比`grep`,它在处理大文件和复杂模式时更具优势。安装`rg`可通过软件包管理器,如在Debian系系统中使用`sudo apt install ripgrep`。基本用法包括简单搜索、递归搜索、忽略大小写、显示行号等。高级功能包括固定字符串搜索、多文件匹配、并行搜索、排除选项和区域搜索。适用于日志分析、代码审查等场景,是提升工作效率的利器。