【问题标题】:Matching numbers in two different files using awk使用 awk 匹配两个不同文件中的数字
【发布时间】:2014-05-25 17:21:30
【问题描述】:

我有两个文件(f1 和 f2),都由三列组成,长度不同。我想通过以下方式创建一个包含四列的新文件:

f1             f2
1 2 0.2        1 4 0.3
1 3 0.5        1 5 0.2
1 4 0.2        2 3 0.6
2 2 0.5        
2 3 0.9

如果前两列中的数字出现在两个文件中,那么我们打印每个文件的前两个数字和第三个数字(例如,两者都有1 4,f3 中应该有1 4 0.2 0.3;否则,如果 f2 中缺少前两个数字,则只需在第四列中打印一个零。

这些例子的完整结果应该是

f3
1 2 0.2 0
1 3 0.5 0
1 4 0.2 0.3
2 2 0.5 0
2 3 0.9 0.6

我写的脚本如下:

awk '{str1=$1; str2=$2; str3=$3; 
     getline < "f2"; 
     if($1==str1 && $2==str2)
        print str1,str2,str3,$3 > "f3";
     else
        print str1,str2,str3,0 > "f3";
}' f1

但它只是查看相同的两个数字是否在同一行中(它不会遍历所有 f2 文件)作为结果给出

1 2 0.2 0
1 3 0.5 0
1 4 0.2 0
2 2 0.5 0
2 3 0.9 0

【问题讨论】:

    标签: bash awk


    【解决方案1】:

    这个 awk 应该可以工作:

    awk 'FNR==NR{a[$1,$2]=$3;next} {print $0, (a[$1,$2])? a[$1,$2]:0}' f2 f1
    1 2 0.2 0
    1 3 0.5 0
    1 4 0.2 0.3
    2 2 0.5 0
    2 3 0.9 0.6
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-08-08
      • 2016-12-09
      • 1970-01-01
      • 2011-11-24
      • 1970-01-01
      • 2019-05-04
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多