Linux文本的处理

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
简介: Linux最最最最重要的哲学思想就是:一切皆文件。文件以及文件的操作在LInux操作系统中是非常的重要。熟练使用精悍小巧快捷的文本处理方式让效率更高。一、文件查看命令less 分页查看[root@centos7 app]# cat /etc/passwd |lesscat空行指的是没有任何字符,如果一行中只有空格那也不能称为空行。

img_6393179b3c0e3974df515c7eab378e32.png

Linux最最最最重要的哲学思想就是:一切皆文件。文件以及文件的操作在LInux操作系统中是非常的重要。熟练使用精悍小巧快捷的文本处理方式让效率更高。

一、文件查看命令

less 分页查看

[root@centos7 app]# cat /etc/passwd |less

cat

空行指的是没有任何字符,如果一行中只有空格那也不能称为空行。

  • 对每一行进行编号,不论一行有没有内容都显示行号。

    [root@centos7 app]# cat -n /etc/passwd
  • 对非空行进行编号
    如果一行当中只有空格,那么这一行也不是非空行。使用-b时也进行编号

    [root@centos7 app]# cat -b file
  • 压缩空行
    压缩连续的空行为一行,一行中只有空格那也不是空行

    [root@centos7 app]# cat -s file
  • 在每一行结束地添加$

    [root@centos7 app]# cat -E $ /etc/passwd

二、分页查看内容

  • 分页查看more
    能显示文件剩余的百分比

    [root@centos7 app]# more passwd 
    [root@centos7 app]# cat passwd | more 
  • 分页查看less

    [root@centos7 app]# cat /etc/profile.d/colorls.sh  | less

    less可以使用搜索使用 /string搜索字符串。
    n或者N跳转到下一个或者上一个匹配。
    ***

    三、截取文本的前行或者后行

  • head
    截取指定前几行或者前几字节的内容

    [root@centos7 app]# cat colorls.sh | head -c 10            #显示指定前10字节
    [root@centos7 app]# cat colorls.sh | head -n 10            #显示指定前10行
    [root@centos7 app]# cat colorls.sh | head -10
  • tail
    tail与head正好相反,作用是截取文本的后几行或后几字节。
    tail与head常常搭配使用截取除指定的行

    [root@centos7 app]# cat clorls.sh | tail -c 10             #显示指定后10字节
    [root@centos7 app]# cat clorls.sh | tail -n 10             #显示指定后10行
    [root@centos7 app]# cat clorls.sh | tail -10               #显示指定后10行
  • head与tail搭配使用,精确找出第三行

    [root@centos7 app]# cat file|head -3|tail -1

四、截取文本的某一列

  • cut
    cut可以指定分隔符后,截取出指定的列。如果一行没有分隔符的话,整行输出。
 #指定冒号为分隔符,只显示第2列
[root@centos7 app]# cat file |cut -d: -f2       
 #指定冒号为分隔符,显示2到3列        
[root@centos7 app]# cat file |cut -d: -c2-3             
#
#如果分隔符有歧义,那么需要加引号
[root@centos7 app]# cat file |cut -d";" -f2 
  • paste
    将两个文本同行号的内容,输出到一行
默认使用tab做分隔符
[root@centos7 app]# paste file file2
1       a
1       a
1       a
#指定冒号作文分隔符
[root@centos7 app]# paste -d: file file2
#将所有内容输出到一行
[root@centos7 app]# paste -s file file2
1       1       1
a       a       a

五、文本统计工具与排序

  • wc可以用来统计行数,字数,字符数

    [root@centos7 app]# wc passwd 
      42     88    2308    passwd
     行数  文字数   字符数   文件名
    #
    #统计行数
    [root@centos7 app]# wc passwd -l
    42 passwd
    #统计字符数
    [root@centos7 app]# wc passwd -w
    88 passwd
    #统计字节数
    [root@centos7 app]# wc passwd -c
    2308 passwd
  • sort工具用来对文本进行排序

    #删除重复的行
    [root@centos7 app]# sort -u file2
    #按字数的大小进行排序
    [root@centos7 app]# sort -n file2
    #    -r 执行反方向(由上至下)整理
    #    -n 执行按数字大小整理
    #    -f 选项忽略(fold)字符串中的字符大小写
    #    -u 选项(独特,unique)删除输出中的重复行
    #    -t c 选项使用c做为字段界定符
    #    -k X 选项按照使用c字符分隔的X列来整理能够使用多次
  • uniq 删除连续重复的行为一行

    压缩连续重复的行为一行
    [root@centos7 app]# uniq file2
    #统计每行重复出现的次数
    [root@centos7 app]# uniq file2 -c
    #显示不曾连续重复的行
    [root@centos7 app]# uniq file2 -u

    练习题

1、找出ifconfig “网卡名” 命令结果中本机的IPv4地址

[root@centos7 app]# ifconfig ens33 |head -2|tail -1|tr -s ' '|cut -d ' ' -f3
192.168.0.129

解析

ifconfig ens3--------显示网卡信息
head -2|tail -1------保留IP信息的一行
tr -s ' ' -----------将空格压缩
cut -d ' ' -f3-------空格为分隔符显示出第三列

2、查出分区空间使用率的最大百分比值

[root@centos7 app]# df -h| tr -s ' '|cut -d ' ' -f5
Use%
7%
0%
1%

解析

tr -s ' '--------------压缩空格
cut -d ' ' -f5---------以空格为分隔符,截取第五列

3、查出用户UID最大值的用户名、UID及shell类型

[root@centos7 app]# cut -d: -f1,3,7 /etc/passwd|sort -t : -k 2 -n|tail -1
nfsnobody:65534:/sbin/nologin

解析

cut -d: -f1,3 /etc/passwd-----以:为分隔符,取1,3列
sort -t : -k 2 -n-------------以:作为分隔符,按第二列从小到大排序
tail -1-----------------------排序后最后一行是最大的,所以取最后一行

4、查出/tmp的权限,以数字方式显示

#用命令本身的快捷方法
[root@centos7 app]# stat -c %a /tmp/
1777
#用本章的知识解决
[root@centos7 app]# stat /tmp/ | head -n4|tail -1|tr '(' '/'|cut -d/ -f2
1777

解析

stat /tmp/ -----------------此命令可以查看到目录数字形式的权限
head -n4--------------------数字权限在第四行,所以取出前四行
tail -1---------------------取出只有数字权限的一行
|tr '(' '/'-----------------设置分隔符
cut -d/ -f2-----------------取出权限

目录
相关文章
|
4月前
|
Linux Shell Perl
Linux下的Shell基础——文本处理工具(五)
Linux下的Shell基础——文本处理工具(五)
48 1
Linux下的Shell基础——文本处理工具(五)
|
4月前
|
存储 Shell Linux
【Shell 命令集合 文档编辑】Linux 文本统计 wc命令使用指南
【Shell 命令集合 文档编辑】Linux 文本统计 wc命令使用指南
106 0
|
28天前
|
Linux
Linux 系列之 在一个文本中查找指定的数据
文章介绍了在Linux命令行中使用文本搜索功能快速查找指定内容的方法,并提供了按`n`键查找下一个匹配项的技巧。
Linux 系列之 在一个文本中查找指定的数据
|
28天前
|
Linux
在Linux中,如何使用grep命令搜索文本?
在Linux中,如何使用grep命令搜索文本?
|
2月前
|
Shell Linux C语言
|
4月前
|
Linux C语言 C++
Linux Shell_cut命令(按列提取文本字符)
Linux Shell_cut命令(按列提取文本字符)
62 0
|
3月前
|
数据挖掘 Linux Perl
Linux命令join:高效处理文本数据的利器
`join`是Linux文本处理的强兵,用于基于共同字段合并两个已排序文件。它按字典序比较字段,支持自定义分隔符,且能处理未匹配行。`-a`显示未匹配行,`-e`指定空字段替换值,`-j`设置共同字段,`-o`定制输出格式,`-t`定义字段分隔符。在数据分析时,务必先排序文件,并根据需求调整参数。可与`sort`、`cut`等命令配合使用。
|
2月前
|
存储 Unix Linux
探索Linux中的sed命令:强大的文本处理工具
`sed`是Linux/Unix的流编辑器,用于文本替换、删除、新增等操作,无需直接编辑文件。它逐行处理输入,存储在模式空间,执行脚本后输出。主要特点是非交互、支持正则表达式和简洁语法。示例:`sed 's/apple/orange/g' example.txt`替换文本,`/error/d`删除包含"error"的行,`a\---`在每行后加"---"。使用时注意备份、测试命令和理解正则表达式。
|
3月前
|
监控 Unix Linux
windows和linux实时监控文本内容的命令
windows和linux实时监控文本内容的命令
84 1
|
3月前
|
数据挖掘 Unix Linux
探索Linux中的强大文本处理工具——dgawk
dgawk,GNU awk的增强版,是一款强大的Linux文本处理工具,擅长模式扫描和数据提取。它提供复杂文本分析、易用性、可定制脚本及高效处理大文件的能力。基本语法为`dgawk 'pattern { action }' file`。通过打印、模式匹配、字段操作、BEGIN/END块及自定义函数等功能,用户能高效处理文本数据。掌握dgawk能提升文本分析效率,对系统管理员和数据分析师尤其有用。