从制表符分隔的输入文件中删除特定字段答案

【问题标题】：remove specific fields from tab separated input file从制表符分隔的输入文件中删除特定字段
【发布时间】：2018-04-21 11:16:04
【问题描述】：

带有制表符分隔字段的输入文件#1：

one     two     three   four    five    six     four
one     two     three   four    five    six     four
one     two     three   four    five    six     four

case1：我需要从每一行中删除所有包含字符串的字段，例如 four 并获得仍然单个 TAB 分隔的剩余字段。

case2：我需要删除第 n 列，并为输出中的剩余字段保留一个 TAB 分隔符，但在这里我得到了多个 TAB：

$ echo -e "one\ttwo\tthree\tfour\tfive\tsix\tfour\none\ttwo\tthree\tfour\tfive\tsix\tfour\none\ttwo\tthree\tfour\tfive\tsix\tfour"|awk -F"[\t]" '{$3="";$5=""}{print $0}' OFS='\t'
one     two             four            six     four
one     two             four            six     four
one     two             four            six     four

我可以通过tr -s '\t' 发送输出来修复它，但是如何修改awk 以避免tr 命令？

【问题讨论】：

所以你期待one|two|four|six|four ?
抱歉，我从描述中删除了误导性内容。我需要在输出上使用单个 TAB 分隔字段。
没有什么是误导。我所说的单个管道也指单个选项卡。

标签： awk gawk

【解决方案1】：

即使awk 是一个可行的解决方案，您也可以通过管道输出到sed：

sed 's/\t*[^\t]*four[^\t]*//g'

或者awk:

awk -F\\t '{r = ""; for(i=1; i<=NF; i++) if($i !~ /four/) r = (r=="" ? "" : r FS) $i; print r}'

【讨论】：