【问题标题】:sort and uniq csv files排序和 uniq csv 文件
【发布时间】:2011-09-13 15:28:11
【问题描述】:

使用 linux 命令, 我有一个引用的 csv 文件,我按第一列和第二列排序,现在我想删除它们在第一列和第二列中匹配的重复项,该怎么做? uniq 似乎还不够,是吗?

【问题讨论】:

    标签: sorting duplicates uniq


    【解决方案1】:

    您可以反转 (rev) 文件,然后 uniq 忽略前 N-2 个字段(除前两列之外的所有字段),然后再次 rev。

    rev | uniq -f N-2 -u | rev
    

    【讨论】:

      【解决方案2】:

      好的,我更好地了解您现在需要什么。使用 awk 怎么样?

      http://www.unix.com/shell-programming-scripting/62574-finding-duplicates-columns-removing-lines.html

      【讨论】:

      • 如果有 超过 2 列,可能会出现问题。
      • 我已经对文件进行了排序,而 uniq 无法解决我的问题约束,我认为只有前两列相同的行才相同。
      • 是的,但是uniq 会考虑整行,除非你告诉它只考虑前两个字段。类似@mjvotaw 的建议
      猜你喜欢
      • 1970-01-01
      • 2013-03-07
      • 1970-01-01
      • 2018-09-29
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多