计算文件中的单词数、行数和字符数

可以使用 wc 命令对文件中的单词数、行数、字符数进行统计,默认使用 wc 会三个数据都显示(顺序为:行数、单词数、字节数),但是也可以使用其 -w 指定只显示单词数,使用其 -l 指定只显示行数,使用其 -m 选项指定只显示字符数,使用其 -c 选项指定只显示字节数(可以使用man手册查询其他的选项功能),一个例子如下:

wc的使用

对文件中的行编号

在处理代码时,很有必要为代码设置行号,可以使用命令 nl 来带行号查看文件,默认不为空白行编号(等同于使用选项 -b t ),如果想为空白行进行编号,可以使用其选项 -b a ,一个综合的实例如下:

nl对内容进行编号

选择分隔文件中的整列

使用命令 cut 可以对文件(或输入流)中的数据进行分隔,默认按照水平制表符来分隔列。可以使用其选项 -d 指定分隔符,同时可以使用其选项 --out-delimiter 来指定输出的分隔符是啥,此外,可以使用其选择 -f 指定显示哪几列的数据,一个综合案例如下:

cut的使用

使用sort进行行排序

使用命令 sort 可以对文件中的行进行排序,默认按照每行的首字符的顺序排序。可以使用选项 -t 指定分隔符的同时使用选项 -k 指定按照分隔后的哪一列来进行排序,如果想倒序,就使用选项 -r 。此外如果想按照数字的大小来排序(否则将按照数字字符串的首字符来排序),可以使用选项 -n ,使用 -h 可以识别数字带的单位来排序,而不是单纯的按照数字大小。一个综合的例子如下:

sort的使用

删除文件中的重复行

使用命令 uniq 可以删除文件中的重复行,但是他只会消除相邻的重复行,所以在消除重复行之前可以对文件中的行进行排序(使用 sort 命令),此外,使用其选项 -c 可以统计消除重复行的次数。一个例子如下:

uniq的使用

tr的使用