在 awk 中嵌套 for 循环以计算匹配值的字段数答案

【问题标题】：nested for loops in awk to count number of fields matching values在 awk 中嵌套 for 循环以计算匹配值的字段数
【发布时间】：2015-05-01 19:06:48
【问题描述】：

我有一个包含两列（140 万行）的文件，如下所示：

我想计算每个可能的值组合的实例；例如，如果有 x 行，其中 CLM 列等于 0，MXL 列匹配 1，我想打印：

0 1 x

由于 CLM 列的最大值为 188，MXL 列的最大值为 128，因此我尝试在 awk 中使用嵌套的 for 循环，如下所示：

awk '{for (i=0; i<=188; i++) {for (j=0; j<=128; j++) {if($9==i && $10==j) {print$0}}}}' 1000Genomes.ALL.new.txt > test

但这只会打印出原始文件，这是有道理的，我只是不知道如何正确编写一个 for 循环，为每个值组合打印出一个文件，然后我可以 wc 或打印出一个每个组合的计数文件。 awk、bash 脚本、perl 脚本中的任何解决方案都会很棒。

【问题讨论】：

标签： loops awk

【解决方案1】：

1。纯`awk` 解决方案

$ awk 'NR>1{c[$0]++} END{for (k in c)print k,c[k]}' file | sort -n
0 0 3
0 1 1
1 1 2
29 42 1
30 15 1

代码使用单个变量c。 c 是一个关联数组，其键是文件中的行，值是出现次数。

$ tail -n+2 file | sort -n | uniq -c | awk '{print $2,$3,$1}'
0 0 3
0 1 1
1 1 2
29 42 1
30 15 1

【讨论】：