【问题标题】:Merge two rows with condition AWK使用条件 AWK 合并两行
【发布时间】:2016-11-09 12:52:03
【问题描述】:

我有疑问。我想将两三行有条件的合并成一行有特定的打印。

输入:文件有 6 行和制表符分隔

LOL   h/h  2  a  b  c
LOLA  h/h  3  b  b  b
SERP  w/w  4  c  c  c 
DARD  s/s  5  d  d  d 
GIT   w/w  6  a  b  c
GIT   h/h  6  a  a  b
GIT   d/d  6  a  b  b
LOL   h/h  7  a  a  a

输出:有2个条件:if($1s 相同,$3s 相同)合并行与特定打印

LOL   h/h  2  a  b  c
LOLA  h/h  3  b  b  b
SERP  w/w  4  c  c  c 
DARD  s/s  5  d  d  d 
GIT   w/w  6  a  b  c h/h  6  a  a  b d/d  6  a  b  b
LOL   h/h  7  a  a  a

我有这个代码:

awk -F'\t' -v OFS="\t" 'NF>1{a[$1] = a[$1]"\t"$2"\t"$3"\t"$4"\t"$5"\t"$6};END{for(i in a){print i""a[i]}}'

但它仅由第一列合并,我不确定使用此代码是否好。

【问题讨论】:

  • 在输入中,我只看到一个文件...你能添加第二个文件吗
  • 也可以在一个文件中复制$1
  • 对不起,我想用这个条件合并行。我修好了。

标签: awk printing merge uniq


【解决方案1】:

在 awk 中:

$ awk '($1 FS $3) in a{k=$1 FS $3; $1=""; a[k]=a[k] $0;next} {a[$1 FS $3]=$0} END {for(i in a) print a[i]}' file
SERP  w/w  4  c  c  c
LOL   h/h  2  a  b  c
LOLA  h/h  3  b  b  b
DARD  s/s  5  d  d  d
LOL   h/h  7  a  a  a
GIT   w/w  6  a  b  c h/h 6 a a b d/d 6 a b b

解释:

($1 FS $3) in a {  # if keys already seen in array a
    k=$1 FS $3
    $1=""           # remove $1
    a[k]=a[k] $0    # append to existing
    next
} 
{ a[$1 FS $3]=$0 }  # if keys not seen, see them
END { 
    for(i in a)     # for all stored keys 
        print a[i]  # print
}

【讨论】:

  • 谢谢詹姆斯和杰
【解决方案2】:

这是支持多维数组的 gawk v4 的答案。第一个文件的一列存储在一个多维数组中,很容易与第二个文件列进行比较。我的解决方案显示了一个示例 printf,您可以根据需要对其进行修改。

#!/bin/gawk -f

NR==FNR {          # for first file
    a[$1][0] = $2; # Store columns in
    a[$1][1] = $3; # multi dimensional
    a[$1][2] = $4; # array
    a[$1][3] = $5;
    a[$1][4] = $6;
    next;
}

$1 in a && $3 == a[$1][1] {
    printf("%s\t%s\n", $2, a[$1,0])
}

【讨论】:

  • 通过数组获得结果真的很不错
【解决方案3】:

在我不能使用多维数组的地方使用 gawk v3 回答

#!/bin/gawk -f

NR==FNR {
   a[$1]
   b[$1] = $2;
   c[$1] = $3;
   d[$1] = $4;
   e[$1] = $5;
   f[$1] = $6;
   next;
}

$1 in a && $3 == c[$1] {
    print $0
}

单线

gawk 'NR==FNR {a[$1]; b[$1] = $2; c[$1] = $3; d[$1] = $4; e[$1] = $5; f[$1] = $6; next; } $1 in a && $3 == c[$1] { print $0 }' /tmp/file1 /tmp/file2

【讨论】:

    猜你喜欢
    • 2016-07-30
    • 2019-06-14
    • 2015-07-11
    • 1970-01-01
    • 2015-02-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多