介绍
sort命令是一个文本排序命令,它能对标准输入和文本文件进行排序,并且能将结果通过stdout输出,sort命令经常会同uniq命令一起使用。sort命令的排序原理默认是从每一行的第一个字符开始对比直到行的最后一个字符结束(比如第一个字符相同就对比第二个字符),比较方式一般是数字比较,字母的顺序比较。
参数:
-b:忽略每行前面开始出的空格字符; -c:检查文件是否已经按照顺序排序; -d:排序时,处理英文字母、数字及空格字符外,忽略其他的字符; -f:排序时,将小写字母视为大写字母; -i:排序时,除了040至176之间的ASCII字符外,忽略其他的字符; -m:将多个输入结果或者文件的内容进行合并,不对合并后的结果再进行排序; -M:按月份进行排序; -n:以数字进行排序; -o<输出文件>:将排序后的结果存入制定的文件; -r:以倒序的顺序来排序; -t<分隔字符>:指定排序时列分隔字符,默认是使用空格做为分隔符; -k:指定对比列或开始位置和结束位置
测试数据
[root@localhost test]# cat test 1:jan:b 2:jan:a 2:feb:b 3:mar:c 5:may:d 4:apr:e
1.默认排序
[root@localhost test]# sort test; 1:jan:b 2:feb:b 2:jan:a 3:mar:c 4:apr:e 5:may:d
默认是从第一个字符开始做对比每行,从上图的对比可以看到当第一个字符2相同的时,开始对比接下来的字符对比到第三个字符f是排在j的前面
2.倒序排序,-r
[root@localhost test]# sort -r test 5:may:d 4:apr:e 3:mar:c 2:jan:a 2:feb:b 1:jan:b
3.按月份进行排序
[root@localhost test]# sort -Mk 2 -t: test; 1:jan:b 2:jan:a 2:feb:b 3:mar:c 4:apr:e 5:may:d
-M:指定是根据月份进行对比,-k:指定对比的列是第二列,这里的-k参数比较特殊因为是和-M一起使用后明确了只对比第二列(类似使用 -k 2,2),如果第二列相同再从开始处进行对比,如果不是明确指定了对比的字符默认是从指定的字符开始对比到该行的结束。
注意:当对比的内容中分隔符不是默认的空格时,需要明确指定-t参数指定分隔符
4.-k参数
-k参数比较复杂,参数用来指定对比的开始和结束字符
-k start[.start1][,end[.end1]]
中括号里面的可以省略,
1.如果只指定了start:代表从第start列的第一个字符开始比较到该行的结尾
2.如果指定了start,end:代表从start列的一个字符开始到end列的最后一个字符结束,如果从start开始到end结束对比的记录完全相同则重新从行的开始处再开始匹配。
3.如果指定了start.start1:代表从start列的第start1个字符开始对比
[root@localhost test]# sort -k 2 -t: test; 4:apr:e 2:feb:b 2:jan:a 1:jan:b 3:mar:c 5:may:d
注意:由于只指定了start,所以从第二列的第一个字符开始对比直到行的结束,注意观察jan两列。
[root@localhost test]# sort -k 2,2 -t: test; 4:apr:e 2:feb:b 1:jan:b 2:jan:a 3:mar:c 5:may:d
注意:由于没有指定.start1和.end1所以先对比第2列,当第二列相同的情况下从行的开始再进行对比,注意观察jan两列。
[root@localhost test]# sort -k 2.2,2.3 -t: test; 1:jan:b 2:jan:a 3:mar:c 5:may:d 2:feb:b 4:apr:e
注意1,2两行,由于ja相同所以从行的开始处再进行对比,而不是从行的后面再进行对比,注意观察jan两列。
总结
本文转自pursuer.chen(陈敏华)博客园博客,原文链接:http://www.cnblogs.com/chenmh/p/5520498.html,如需转载请自行联系原作者