【发布时间】:2011-06-16 22:15:56
【问题描述】:
在这里,我希望通过删除除前两列之外的列中具有相同值的行来帮助您修剪文件。
我拥有的文件(制表符分隔,包含数百万行和数十列)
Jack Mike Jones Dan Was
1 2 7 3 4
2 3 9 4 8
T T C T T
T M T T T
W A S I S
我想要的文件(删除单元格中除前两个之外具有相同值的行)
Jack Mike Jones Dan Was
1 2 7 3 4
2 3 9 4 8
T T C T T
W A S I S
你能给我一些关于我的问题的提示吗?非常感谢。
我在related question 中体验过几个优秀的awk、shell 和perl 脚本。非常感谢帮助者。
【问题讨论】:
-
请发布您目前拥有的代码/您尝试过的代码/等等。以你的最后一个问题为基础。
-
您真的很快就会向他们发布问题,想知道您是否有时间在发布新问题之前将收到的答案合并到您的程序中
-
比较前两列,如果相同则丢弃。现在检查剩余数据行中的重复项。 (假设 FMc 指出存在错误)。
-
@aartist:我的理解是:对于每一行 { 读取行,忽略前 2 列,如果其余列都有一个相同的值:丢弃行。 }