【发布时间】:2011-09-13 15:28:11
【问题描述】:
使用 linux 命令, 我有一个引用的 csv 文件,我按第一列和第二列排序,现在我想删除它们在第一列和第二列中匹配的重复项,该怎么做? uniq 似乎还不够,是吗?
【问题讨论】:
标签: sorting duplicates uniq
使用 linux 命令, 我有一个引用的 csv 文件,我按第一列和第二列排序,现在我想删除它们在第一列和第二列中匹配的重复项,该怎么做? uniq 似乎还不够,是吗?
【问题讨论】:
标签: sorting duplicates uniq
您可以反转 (rev) 文件,然后 uniq 忽略前 N-2 个字段(除前两列之外的所有字段),然后再次 rev。
rev | uniq -f N-2 -u | rev
【讨论】:
好的,我更好地了解您现在需要什么。使用 awk 怎么样?
http://www.unix.com/shell-programming-scripting/62574-finding-duplicates-columns-removing-lines.html
【讨论】:
uniq 会考虑整行,除非你告诉它只考虑前两个字段。类似@mjvotaw 的建议