【问题标题】:How to find files with duplicated content in given a directory? SHELL [closed]如何在给定目录中查找具有重复内容的文件?壳牌[关闭]
【发布时间】:2013-11-09 08:38:29
【问题描述】:

我需要在给定目录中查找具有相同(重复)内容的文件。而且我需要使用shell代码。

【问题讨论】:

  • 您使用的是哪个操作系统?
  • 与其比较每对文件,这将花费 n 个文件的 O(n^2) 时间,而是使用例如散列它们要快得多。 md5sum。您可以对其输出进行排序,所有相同的文件将彼此相邻显示。
  • 请不要更新标题以表明您的问题已经解决。只需接受一个答案(你已经完成了)。

标签: shell directory find


【解决方案1】:

试试这个:BASH

find -type f -exec md5sum '{}' ';' | sort | uniq --all-repeated=separate -w 33 | cut -c 35-

说明

查找所有文件,计算其 MD5SUM,通过比较 MD5SUM 查找重复项,打印名称

【讨论】:

  • 不知道-w--all-repeateduniq,谢谢!
  • @DariusDarius 如果没问题,请将其标记为已解决,这样会更有礼貌。
  • @j_random_hacker 在这里阅读...commandlinefu.com/commands/view/3555/…
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-06-22
  • 1970-01-01
  • 1970-01-01
  • 2013-04-22
  • 2012-04-02
  • 2021-01-28
相关资源
最近更新 更多