Linux文本处理入门深入解析动手实操

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: 学习Linux系统中的文本编辑工具Vim以及文本处理命令。

1. 创建资源

创建资源

1. 单击屏幕右侧 创建资源 ,免费创建当前实验所需云产品资源。

说明:

资源创建过程需要1~3分钟。完成实验资源的创建后,您可以在 云产品资源 列表查看已创建的资源信息,例如:IP地址、子用户名称和子用户密码等。

2. 连接终端

1. 资源创建完毕后,点击右侧 Web Terminal连接ECS服务器。

3. 文本编辑工具Vim

文本编辑工具Vim

vim的三种操作模式

vim有三种操作模式,分别是命令模式(Command mode)、输入模式(Insert mode)和底线命令模式(Last line mode)。

三种模式切换快捷键:

模式

快捷键

命令模式

ESC
输入模式

i或a

底线命令模式

:

命令模式

在命令模式中控制光标移动和输入命令,可对文本进行复制、粘贴、删除和查找等工作。

使用命令vim filename后进入编辑器视图后,默认模式就是命令模式,此时敲击键盘字母会被识别为一个命令,例如在键盘上连续敲击两次d,就会删除光标所在行。

以下是在命令模式中常用的快捷操作:

操作

快捷键

光标左移

h

光标右移 l(小写L)
光标上移

k

光标下移

j

光标移动到下一个单词

w

光标移动到上一个单词

b

移动游标到第n行

nG

快速回到上一次光标所在位置 Ctrl+o
删除至行尾 d$或D


输入模式

在命令模式下按i或a键就进入了输入模式,在输入模式下,您可以正常的使用键盘按键对文本进行插入和删除等操作。

底线命令模式

在命令模式下按:键就进入了底线命令模式,在底线命令模式中可以输入单个或多个字符的命令。

操作

命令

保存

:w

退出

:q

显示行号

:set nu

取消行号

:set nonu

使本行内容居中

:ce

使本行文本靠右

:ri

使用示例

在本示例将使用vim在文本文件中写入一首唐诗。

1. 新建一个文件并进入vim命令模式(因为涉及中文需要您自行点击右下角进行中英文切换)。


2. 按下i进入输入模式,输入《静夜思》的诗名。

3. 按下ECS键回到命令模式,并输入底线命令:ce,使诗名居中。

4. 按下o键换行并进入输入模式,输入第一行诗。

5. 按下ECS键回到命令模式,并输入底线命令:ce,使第一行诗居中。

6. 按下o键换行并进入输入模式,输入第二行诗。

7. 按下ECS键回到命令模式,并输入底线命令:ce,使第二行诗居中。

8. 在命令模式中执行底线命令:wq离开vim。

4. 文本文件查看命令

文本文件查看命令

cat

命令描述:cat命令用于查看内容较少的纯文本文件。

命令格式:cat [选项] [文件]。

命令参数说明:

参数 说明
-n或--number 显示行号
-b或--number-nonblank 显示行号,但是不对空白行进行编号
-s或--squeeze-blank 当遇到有连续两行以上的空白行,只显示一行的空白行

命令使用示例:

1.   将一个自增序列写入test.txt文件中。

for i in $(seq 1 10); do echo $i >> test.txt ; done

2.  查看文件内容。

cat test.txt

命令输出结果:

3.  将文件内容清空。

cat /dev/null > test.txt

4.  再次检查文件内容。

cat test.txt

命令输出结果:

more

命令描述:more命令从前向后分页显示文件内容。

常用操作命令:

操作 作用
Enter 向下n行,n需要定义,默认为1行
Ctrl+F或空格键(Space) 向下滚动一页
Ctrl+B 向上滚动一页
= 输出当前行的行号
!命令 调用Shell执行命令

命令使用示例:

从第20行开始分页查看系统日志文件/var/log/messages。

more +20 /var/log/messages


less

命令描述:less命令可以对文件或其它输出进行分页显示,与moe命令相似,但使用 less 可以随意浏览文件,而 more 仅能向前移动,却不能向后移动。

命令格式:less [参数] 文件 。

命令参数说明:

参数 说明
-e 当文件显示结束后,自动离开
-m 显示类似more命令的百分比
-N 显示每行的行号
-s 显示连续空行为一行

命令常用操作:

快捷键 说明
/字符串 向下搜索字符串
?字符串 向上搜索字符串
n 重复前一个搜索
N 反向重复前一个搜索
b或pageup键 向上翻一页
空格键或pagedown键 向下翻一页
u 向前翻半页
d 向后翻半页
y 向前滚动一行

命令使用示例:

查看命令历史使用记录并通过less分页显示。

history | less

diff

命令描述:diff命令用于比较文件的差异。

命令使用示例:

1.  构造两个相似的文件

echo-e'第一行\n第二行\n我是log1第3行\n第四行\n第五行\n第六行' > 1.log
echo-e'第一行\n第二行\n我是log2第3行\n第四行' > 2.log

2.  分别查看两个文件

3.  使用diff查看两个文件的差异

对比结果中的3c3表示两个文件在第3行有不同,5,6d4表示2.log文件相比1.log文件在第4行处开始少了1.log文件的第5和第6行。

5. 文本文件处理命令

grep

命令描述:grep命令用于查找文件里符合条件的字符串。

grep全称是Global Regular Expression Print,表示全局正则表达式版本,它能使用正则表达式搜索文本,并把匹配的行打印出来。

在Shell脚本中,grep通过返回一个状态值来表示搜索的状态:

0:匹配成功。

1:匹配失败。

2:搜索的文件不存在。

命令使用示例:

查看sshd服务配置文件中监听端口配置所在行编号。

grep -n Port /etc/ssh/ssh_config

查询字符串在文本中出现的列数。

grep -c localhost /etc/hosts

反向查找,不显示符合条件的行。

ps -ef | grep sshd

ps -ef | grep -v grep | grep sshd


sed

命令描述:sed是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用。

1. 处理时,把当前处理的行存储在临时缓冲区中,称为模式空间(pattern space)。

2. 接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。

3. 接着处理下一行,这样不断重复,直到文件末尾。

注意:

sed命令不会修改原文件,例如删除命令只表示某些行不打印输出,而不是从原文件中删去。

如果要改变源文件,需要使用-i选项。


awk

命令描述:和 sed 命令类似,awk 命令也是逐行扫描文件(从第 1 行到最后一行),寻找含有目标文本的行,如果匹配成功,则会在该行上执行用户想要的操作;反之,则不对行做任何处理。

awk中还可以指定脚本命令的运行时机。默认情况下,awk会从输入中读取一行文本,然后针对该行的数据执行程序脚本,但有时可能需要在处理数据前运行一些脚本命令,这就需要使用BEGIN关键字,BEGIN会在awsk读取数据前强制执行该关键字后指定的脚本命令。

和BEGIN关键字相对应,END关键字允许我们指定一些脚本命令,awk会在读完数据后执行它们。





目录
相关文章
|
2月前
|
缓存 并行计算 Linux
深入解析Linux操作系统的内核优化策略
本文旨在探讨Linux操作系统内核的优化策略,包括内核参数调整、内存管理、CPU调度以及文件系统性能提升等方面。通过对这些关键领域的分析,我们可以理解如何有效地提高Linux系统的性能和稳定性,从而为用户提供更加流畅和高效的计算体验。
36 2
|
2月前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
76 4
|
2月前
|
Unix Linux Shell
linux入门!
本文档介绍了Linux系统入门的基础知识,包括操作系统概述、CentOS系统的安装与远程连接、文件操作、目录结构、用户和用户组管理、权限管理、Shell基础、输入输出、压缩打包、文件传输、软件安装、文件查找、进程管理、定时任务和服务管理等内容。重点讲解了常见的命令和操作技巧,帮助初学者快速掌握Linux系统的基本使用方法。
81 3
|
2月前
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####
|
2月前
|
存储 弹性计算 NoSQL
"从入门到实践,全方位解析云服务器ECS的秘密——手把手教你轻松驾驭阿里云的强大计算力!"
【10月更文挑战第23天】云服务器ECS(Elastic Compute Service)是阿里云提供的基础云计算服务,允许用户在云端租用和管理虚拟服务器。ECS具有弹性伸缩、按需付费、简单易用等特点,适用于网站托管、数据库部署、大数据分析等多种场景。本文介绍ECS的基本概念、使用场景及快速上手指南。
93 3
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
Python编程语言的魅力:从入门到进阶的全方位解析
Python编程语言的魅力:从入门到进阶的全方位解析
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
前端大模型入门(三):编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入
本文介绍了大规模语言模型(LLM)中的两个核心概念:Tokenizer和Embedding。Tokenizer将文本转换为模型可处理的数字ID,而Embedding则将这些ID转化为能捕捉语义关系的稠密向量。文章通过具体示例和代码展示了两者的实现方法,帮助读者理解其基本原理和应用场景。
645 1
|
3月前
|
JSON JavaScript 前端开发
深入解析ESLint配置:从入门到精通的全方位指南,精细调优你的代码质量保障工具
深入解析ESLint配置:从入门到精通的全方位指南,精细调优你的代码质量保障工具
117 0
|
Shell Linux
Linux中常用的文本处理命令(echo、sort、uniq、tr、cut、split、eval)(上)
1、echo命令——输出 echo 命令主要用来显示字符串信息。
382 0
|
机器学习/深度学习 Linux Shell
Linux 基础-文本处理命令
Linux 基础-文本处理命令
191 0