[Shell]Join使用

简介: 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/SunnyYoona/article/details/52981239 1. 用途Linux join命令用于将两个文件中,指定栏位内容相同的行连接起来。
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/SunnyYoona/article/details/52981239
1. 用途

Linux join命令用于将两个文件中,指定栏位内容相同的行连接起来。找出两个文件中,指定栏位内容相同的行,并加以合并,再输出到标准输出设备。

2. 语法
 
  
  1. join [OPTION]... FILE1 FILE2
3. 参数

 
   
  1.  -a FILENUM
  2. also print unpairable lines from file FILENUM, where FILENUM is
  3. 1 or 2, corresponding to FILE1 or FILE2
  4. -e EMPTY
  5. replace missing input fields with EMPTY
  6. -i, --ignore-case
  7. ignore differences in case when comparing fields
  8. -j FIELD
  9. equivalent to '-1 FIELD -2 FIELD'
  10. -o FORMAT
  11. obey FORMAT while constructing output line
  12.  -t CHAR
  13. use CHAR as input and output field separator
  14. -v FILENUM
  15. like -a FILENUM, but suppress joined output lines
  16. -1 FIELD
  17. join on this FIELD of file 1
  18. -2 FIELD
  19. join on this FIELD of file 2
  20. --check-order
  21. check that the input is correctly sorted, even if all input
  22. lines are pairable
  23. --nocheck-order
  24. do not check that the input is correctly sorted

假设我们有两个文件:a.txt b.txt

a.txt

 
   
  1. xiaosi@Qunar:~/test$ cat a.txt
  2. aa 1 2
  3. cc 2 3
  4. gg 4 6
  5. hh 3 3

b.txt

 
   
  1. xiaosi@Qunar:~/test$ cat b.txt
  2. aa 2 1
  3. bb 8 2
  4. cc 4 4
  5. dd 5 6
  6. ff 2 3

3.1 -a FileNum 

FileNum 指定哪个文件 (FileNum 只能取值1或者2,1表示 File1,2 表示 File2)

(1)-a 1 等价于 左连接   如果左文件的某行在右文件中没有匹配行,则在结果集行中只显示左文件行中数据

 
   
  1. xiaosi@Qunar:~/test$ join -a 1 a.txt b.txt
  2. aa 1 2 2 1
  3. cc 2 3 4 4
  4. gg 4 6
  5. hh 3 3
(2)-a 2 等价于 右连接  如果右文件的某行在左文件中没有匹配行,则在结果集行中只显示右文件行中数据
 
   
  1. xiaosi@Qunar:~/test$ join -a 2 a.txt b.txt
  2. aa 1 2 2 1
  3. bb 8 2
  4. cc 2 3 4 4
  5. dd 5 6
  6. ff 2 3
(3)无-a 参数 等价于 内连接 
 
   
  1. xiaosi@Qunar:~/test$ join a.txt b.txt
  2. aa 1 2 2 1
  3. cc 2 3 4 4

3.2 -j 指定匹配列

-j选项指定了两个文件具体按哪一列进行匹配

 
  
  1. xiaosi@Qunar:~/test$ join -j 1 a.txt b.txt
  2. aa 1 2 2 1
  3. cc 2 3 4 4

-j 1 指定两个文件按第一列进行匹配,等同于 join a.txt b.txt。

 
  
  1. xiaosi@Qunar:~/test$ join -j 2 c.txt d.txt
  2. 2 cc 3 aa 1
  3. 2 cc 3 ff 3
  4. 4 gg 6 cc 4

-j 2指定两个文件按第二列进行匹配。

备注:

c.txt 为 a.txt按第二列排序后的结果 

 
  
  1. sort -n -k 2 a.txt > c.txt
d.txt 为 b.txt按第二列排序后的结果 
 
  
  1. sort -n -k 2 b.txt > d.txt

如果指定哪一列进行连接,要根据那一列进行排序,再进行连接。


3.3 -v FileNum 反向匹配输出

输出指定文件不匹配的行,FileNum取值1或者2,1表示第一个文件,2表示第二个文件。

 
  
  1. xiaosi@Qunar:~/test$ join -v 1 a.txt b.txt
  2. gg 4 6
  3. hh 3 3
-v 1 表示输出第一个文件中不匹配的行
 
  
  1. xiaosi@Qunar:~/test$ join -v 2 a.txt b.txt
  2. bb 8 2
  3. dd 5 6
  4. ff 2 3
-v 1 表示输出第二个文件中不匹配的行



3.4 -o 格式化输出

格式化输出,指定具体哪一列输出

 
  
  1. xiaosi@Qunar:~/test$ join -o 1.1 1.2 2.2 a.txt b.txt
  2. aa 1 2
  3. cc 2 4
上面代码中表示输出第一个文件的第一列,第二列以及第二个文件的第二列







目录
相关文章
|
6月前
|
Shell Linux C语言
【Shell 命令集合 文本处理工具】Linux 字段连接 join 命令使用指南
【Shell 命令集合 文本处理工具】Linux 字段连接 join 命令使用指南
90 1
|
1月前
|
Shell
一个用于添加/删除定时任务的shell脚本
一个用于添加/删除定时任务的shell脚本
79 1
|
22天前
|
Shell Linux 测试技术
6种方法打造出色的Shell脚本
6种方法打造出色的Shell脚本
45 2
6种方法打造出色的Shell脚本
|
8天前
|
XML JSON 监控
Shell脚本要点和难点以及具体应用和优缺点介绍
Shell脚本在系统管理和自动化任务中扮演着重要角色。尽管存在调试困难、可读性差等问题,但其简洁高效、易于学习和强大的功能使其在许多场景中不可或缺。通过掌握Shell脚本的基本语法、常用命令和函数,并了解其优缺点,开发者可以编写出高效的脚本来完成各种任务,提高工作效率。希望本文能为您在Shell脚本编写和应用中提供有价值的参考和指导。
29 1
|
13天前
|
Ubuntu Shell 开发工具
ubuntu/debian shell 脚本自动配置 gitea git 仓库
这是一个自动配置 Gitea Git 仓库的 Shell 脚本,支持 Ubuntu 20+ 和 Debian 12+ 系统。脚本会创建必要的目录、下载并安装 Gitea,创建 Gitea 用户和服务,确保 Gitea 在系统启动时自动运行。用户可以选择从官方或小绿叶技术博客下载安装包。
35 2
|
27天前
|
监控 网络协议 Shell
ip和ip网段攻击拦截系统-绿叶结界防火墙系统shell脚本
这是一个名为“小绿叶技术博客扫段攻击拦截系统”的Bash脚本,用于监控和拦截TCP攻击。通过抓取网络数据包监控可疑IP,并利用iptables和firewalld防火墙规则对这些IP进行拦截。同时,该系统能够查询数据库中的白名单,确保合法IP不受影响。此外,它还具备日志记录功能,以便于后续分析和审计。
47 6
|
23天前
|
运维 监控 Shell
深入理解Linux系统下的Shell脚本编程
【10月更文挑战第24天】本文将深入浅出地介绍Linux系统中Shell脚本的基础知识和实用技巧,帮助读者从零开始学习编写Shell脚本。通过本文的学习,你将能够掌握Shell脚本的基本语法、变量使用、流程控制以及函数定义等核心概念,并学会如何将这些知识应用于实际问题解决中。文章还将展示几个实用的Shell脚本例子,以加深对知识点的理解和应用。无论你是运维人员还是软件开发者,这篇文章都将为你提供强大的Linux自动化工具。