Linux文本处理入门深入解析动手实操

本文涉及的产品
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
简介: 学习Linux系统中的文本编辑工具Vim以及文本处理命令。

1. 创建资源

创建资源

1. 单击屏幕右侧 创建资源 ,免费创建当前实验所需云产品资源。

说明:

资源创建过程需要1~3分钟。完成实验资源的创建后,您可以在 云产品资源 列表查看已创建的资源信息,例如:IP地址、子用户名称和子用户密码等。

2. 连接终端

1. 资源创建完毕后,点击右侧 Web Terminal连接ECS服务器。

3. 文本编辑工具Vim

文本编辑工具Vim

vim的三种操作模式

vim有三种操作模式,分别是命令模式(Command mode)、输入模式(Insert mode)和底线命令模式(Last line mode)。

三种模式切换快捷键:

模式

快捷键

命令模式

ESC
输入模式

i或a

底线命令模式

:

命令模式

在命令模式中控制光标移动和输入命令,可对文本进行复制、粘贴、删除和查找等工作。

使用命令vim filename后进入编辑器视图后,默认模式就是命令模式,此时敲击键盘字母会被识别为一个命令,例如在键盘上连续敲击两次d,就会删除光标所在行。

以下是在命令模式中常用的快捷操作:

操作

快捷键

光标左移

h

光标右移 l(小写L)
光标上移

k

光标下移

j

光标移动到下一个单词

w

光标移动到上一个单词

b

移动游标到第n行

nG

快速回到上一次光标所在位置 Ctrl+o
删除至行尾 d$或D


输入模式

在命令模式下按i或a键就进入了输入模式,在输入模式下,您可以正常的使用键盘按键对文本进行插入和删除等操作。

底线命令模式

在命令模式下按:键就进入了底线命令模式,在底线命令模式中可以输入单个或多个字符的命令。

操作

命令

保存

:w

退出

:q

显示行号

:set nu

取消行号

:set nonu

使本行内容居中

:ce

使本行文本靠右

:ri

使用示例

在本示例将使用vim在文本文件中写入一首唐诗。

1. 新建一个文件并进入vim命令模式(因为涉及中文需要您自行点击右下角进行中英文切换)。


2. 按下i进入输入模式,输入《静夜思》的诗名。

3. 按下ECS键回到命令模式,并输入底线命令:ce,使诗名居中。

4. 按下o键换行并进入输入模式,输入第一行诗。

5. 按下ECS键回到命令模式,并输入底线命令:ce,使第一行诗居中。

6. 按下o键换行并进入输入模式,输入第二行诗。

7. 按下ECS键回到命令模式,并输入底线命令:ce,使第二行诗居中。

8. 在命令模式中执行底线命令:wq离开vim。

4. 文本文件查看命令

文本文件查看命令

cat

命令描述:cat命令用于查看内容较少的纯文本文件。

命令格式:cat [选项] [文件]。

命令参数说明:

参数 说明
-n或--number 显示行号
-b或--number-nonblank 显示行号,但是不对空白行进行编号
-s或--squeeze-blank 当遇到有连续两行以上的空白行,只显示一行的空白行

命令使用示例:

1.   将一个自增序列写入test.txt文件中。

for i in $(seq 1 10); do echo $i >> test.txt ; done

2.  查看文件内容。

cat test.txt

命令输出结果:

3.  将文件内容清空。

cat /dev/null > test.txt

4.  再次检查文件内容。

cat test.txt

命令输出结果:

more

命令描述:more命令从前向后分页显示文件内容。

常用操作命令:

操作 作用
Enter 向下n行,n需要定义,默认为1行
Ctrl+F或空格键(Space) 向下滚动一页
Ctrl+B 向上滚动一页
= 输出当前行的行号
!命令 调用Shell执行命令

命令使用示例:

从第20行开始分页查看系统日志文件/var/log/messages。

more +20 /var/log/messages


less

命令描述:less命令可以对文件或其它输出进行分页显示,与moe命令相似,但使用 less 可以随意浏览文件,而 more 仅能向前移动,却不能向后移动。

命令格式:less [参数] 文件 。

命令参数说明:

参数 说明
-e 当文件显示结束后,自动离开
-m 显示类似more命令的百分比
-N 显示每行的行号
-s 显示连续空行为一行

命令常用操作:

快捷键 说明
/字符串 向下搜索字符串
?字符串 向上搜索字符串
n 重复前一个搜索
N 反向重复前一个搜索
b或pageup键 向上翻一页
空格键或pagedown键 向下翻一页
u 向前翻半页
d 向后翻半页
y 向前滚动一行

命令使用示例:

查看命令历史使用记录并通过less分页显示。

history | less

diff

命令描述:diff命令用于比较文件的差异。

命令使用示例:

1.  构造两个相似的文件

echo-e'第一行\n第二行\n我是log1第3行\n第四行\n第五行\n第六行' > 1.log
echo-e'第一行\n第二行\n我是log2第3行\n第四行' > 2.log

2.  分别查看两个文件

3.  使用diff查看两个文件的差异

对比结果中的3c3表示两个文件在第3行有不同,5,6d4表示2.log文件相比1.log文件在第4行处开始少了1.log文件的第5和第6行。

5. 文本文件处理命令

grep

命令描述:grep命令用于查找文件里符合条件的字符串。

grep全称是Global Regular Expression Print,表示全局正则表达式版本,它能使用正则表达式搜索文本,并把匹配的行打印出来。

在Shell脚本中,grep通过返回一个状态值来表示搜索的状态:

0:匹配成功。

1:匹配失败。

2:搜索的文件不存在。

命令使用示例:

查看sshd服务配置文件中监听端口配置所在行编号。

grep -n Port /etc/ssh/ssh_config

查询字符串在文本中出现的列数。

grep -c localhost /etc/hosts

反向查找,不显示符合条件的行。

ps -ef | grep sshd

ps -ef | grep -v grep | grep sshd


sed

命令描述:sed是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用。

1. 处理时,把当前处理的行存储在临时缓冲区中,称为模式空间(pattern space)。

2. 接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。

3. 接着处理下一行,这样不断重复,直到文件末尾。

注意:

sed命令不会修改原文件,例如删除命令只表示某些行不打印输出,而不是从原文件中删去。

如果要改变源文件,需要使用-i选项。


awk

命令描述:和 sed 命令类似,awk 命令也是逐行扫描文件(从第 1 行到最后一行),寻找含有目标文本的行,如果匹配成功,则会在该行上执行用户想要的操作;反之,则不对行做任何处理。

awk中还可以指定脚本命令的运行时机。默认情况下,awk会从输入中读取一行文本,然后针对该行的数据执行程序脚本,但有时可能需要在处理数据前运行一些脚本命令,这就需要使用BEGIN关键字,BEGIN会在awsk读取数据前强制执行该关键字后指定的脚本命令。

和BEGIN关键字相对应,END关键字允许我们指定一些脚本命令,awk会在读完数据后执行它们。





目录
相关文章
|
2月前
|
缓存 并行计算 Linux
深入解析Linux操作系统的内核优化策略
本文旨在探讨Linux操作系统内核的优化策略,包括内核参数调整、内存管理、CPU调度以及文件系统性能提升等方面。通过对这些关键领域的分析,我们可以理解如何有效地提高Linux系统的性能和稳定性,从而为用户提供更加流畅和高效的计算体验。
35 2
|
2月前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
75 4
|
2月前
|
Unix Linux Shell
linux入门!
本文档介绍了Linux系统入门的基础知识,包括操作系统概述、CentOS系统的安装与远程连接、文件操作、目录结构、用户和用户组管理、权限管理、Shell基础、输入输出、压缩打包、文件传输、软件安装、文件查找、进程管理、定时任务和服务管理等内容。重点讲解了常见的命令和操作技巧,帮助初学者快速掌握Linux系统的基本使用方法。
81 3
|
2月前
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####
|
3月前
|
弹性计算 网络协议 Ubuntu
如何在阿里云国际版Linux云服务器中自定义配置DNS
如何在阿里云国际版Linux云服务器中自定义配置DNS
|
3月前
|
机器学习/深度学习 Linux 编译器
Linux入门3——vim的简单使用
Linux入门3——vim的简单使用
69 1
|
3月前
|
存储 网络协议 Linux
AWS实操-EC2-创建购买linux(centos)EC2服务器
AWS实操-EC2-创建购买linux(centos)EC2服务器
|
3月前
|
存储 数据可视化 Linux
Linux 基础入门
Linux 基础入门
|
Shell Linux
Linux中常用的文本处理命令(echo、sort、uniq、tr、cut、split、eval)(上)
1、echo命令——输出 echo 命令主要用来显示字符串信息。
382 0
|
机器学习/深度学习 Linux Shell
Linux 基础-文本处理命令
Linux 基础-文本处理命令
191 0