【发布时间】:2017-07-17 17:28:30
【问题描述】:
我想计算文档中的行数并按前缀词对其进行分组。前缀是一组由第一个下划线分隔的字母数字字符。我不太关心对它们进行排序,但最好按出现次数降序列出它们。
文件如下所示:
prefix1_data1
prefix1_data2_a
differentPrefix_data3
prefix1_data2_b
differentPrefix_data5
prefix2_data4
differentPrefix_data5
输出应该如下:
prefix1 3
differentPrefix 3
prefix2 1
我已经在 python 中做到了这一点,但我很好奇是否可以使用命令行或 bash 脚本更有效地做到这一点? uniq 命令有-c 和-w 选项,但前缀的长度可能会有所不同。
【问题讨论】:
-
cut -d'_' -f1 <inputfile| sort |uniq -c
标签: linux bash unix command-line