【发布时间】:2021-02-27 00:38:12
【问题描述】:
我有数据文件
AND (CP),(D),(SE),(SI),(CP),(D),(SE),(SI) (Q),(Q) 1
OR (CP),(D),(E),(SE),(SI),(CP),(D),(E),(SE),(SI) (Q),(Q) 1
DFF (CP),(D),(E),(CP),(D),(E) (QN),(QN) 1
我想输出为
AND (CP),(D),(SE),(SI) (Q) 1
OR (CP),(D),(E),(SE),(SI) (Q) 1
DFF (CP),(D),(E) (QN) 1
我想delete the repeating terms present in column 2 and column 3 例如。在第 2 列的第一行中,CP、D、SE、SI 再次重复,因此它应该在第 3 列中被删除,Q 被重复,所以重复的应该被删除。
我用 awk 试过
awk '!seen[$2]++' file
但是出现错误找不到[
【问题讨论】:
-
重复的词总是在同一个顺序吗?
-
是的,它们总是以相同的顺序重复