7-使用过滤器操作文本文件
文章目录
计算文件中的单词数、行数和字符数
可以使用 wc
命令对文件中的单词数、行数、字符数进行统计,默认使用 wc
会三个数据都显示(顺序为:行数、单词数、字节数),但是也可以使用其 -w
指定只显示单词数,使用其 -l
指定只显示行数,使用其 -m
选项指定只显示字符数,使用其 -c
选项指定只显示字节数(可以使用man手册查询其他的选项功能),一个例子如下:
对文件中的行编号
在处理代码时,很有必要为代码设置行号,可以使用命令 nl
来带行号查看文件,默认不为空白行编号(等同于使用选项 -b t
),如果想为空白行进行编号,可以使用其选项 -b a
,一个综合的实例如下:
选择分隔文件中的整列
使用命令 cut
可以对文件(或输入流)中的数据进行分隔,默认按照水平制表符来分隔列。可以使用其选项 -d
指定分隔符,同时可以使用其选项 --out-delimiter
来指定输出的分隔符是啥,此外,可以使用其选择 -f
指定显示哪几列的数据,一个综合案例如下:
使用sort进行行排序
使用命令 sort
可以对文件中的行进行排序,默认按照每行的首字符的顺序排序。可以使用选项 -t
指定分隔符的同时使用选项 -k
指定按照分隔后的哪一列来进行排序,如果想倒序,就使用选项 -r
。此外如果想按照数字的大小来排序(否则将按照数字字符串的首字符来排序),可以使用选项 -n
,使用 -h
可以识别数字带的单位来排序,而不是单纯的按照数字大小。一个综合的例子如下:
删除文件中的重复行
使用命令 uniq
可以删除文件中的重复行,但是他只会消除相邻的重复行,所以在消除重复行之前可以对文件中的行进行排序(使用 sort
命令),此外,使用其选项 -c
可以统计消除重复行的次数。一个例子如下:
tr的使用
文章作者 P1n93r
上次更新 2019-12-05