使用 awk 或从 linux 上的命令行从文件中删除列答案

【问题标题】：Deleting columns from a file with awk or from command line on linux使用 awk 或从 linux 上的命令行从文件中删除列
【发布时间】：2011-09-26 06:12:19
【问题描述】：

如何使用awk 从制表符分隔的字段文件中删除某些列？

c1 c2 c3 ..... c60

例如，删除在 3 和 29 之间的列。

【问题讨论】：

标签： awk

【解决方案1】：

这就是cut 命令的用途：

cut -f1,2,30- inputfile

默认为制表符。您可以使用-d 开关更改它。

【讨论】：

【解决方案2】：

您可以遍历所有列并过滤掉不需要的列：

awk '{for (i=1; i<=NF; i++) if (i<3 || i>29) printf $i " "; print""}' input.txt

NF 为您提供记录中的字段总数。
对于满足条件的每一列，我们打印该列，后跟一个空格" "。

编辑：在约翰尼的评论后更新：

awk -F 'FS' 'BEGIN{FS="\t"}{for (i=1; i<=NF-1; i++) if(i<3 || i>5) {printf $i FS};{print $NF}}' input.txt

这在两个方面得到了改进：

【讨论】：

【解决方案3】：

awk '{for(z=3;z<=15;z++)$z="";$0=$0;$1=$1}1'

输入

c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 c13 c14 c15 c16 c17 c18 c19 c20 c21

输出

c1 c2 c16 c17 c18 c19 c20 c21

【讨论】：

这不会删除列。它使它们空白并重新打印...用OP指定的O*FS 或\t 替换为一个空格，他们没有要求。明显删除是巧合，需要FS 和OFS 成为默认\s+。一个非常无用的分隔符并且与 OP 的 \t 不兼容，除非他们的文件巧合地不能有空字段，因为它会将它们压缩成锯齿状的行。任何其他分隔符，例如OP 的\t 提供的输出仍然包含不需要的列，但现在为空。而$0 = $0 是多余的，可能是浪费的。记录的重建记录的方法是$1 = $1

【解决方案4】：

不添加前导或尾随空格的 Perl 'splice' 解决方案：

perl -lane 'splice @F,3,27; print join " ",@F' file

产生输出：

c1 c2 c30 c31

【讨论】：