【发布时间】:2018-08-30 13:57:22
【问题描述】:
我有一个多个目录,每个目录都有数千个(10k+)文件。让我们选择一个目录A 有 10k 个文件。我有另一个目录(说它为B),其中包含数千个文件。我正在尝试查找出现在A 和B 中的所有文件,并且还具有特定的文件扩展名(比如说.docx)。我可以轻松地应用嵌套的 for 循环,但由于文件数以千计,因此需要大量时间。 python中有没有更快的方法来执行它?您想建议任何特定的算法或任何 sn-p 代码?
注意 - 我知道如何以多种方式搜索和获取文件,我正在寻求最快方法的建议,文件数以百万计,一次又一次地遍历每一个都将消耗资源..
【问题讨论】:
-
你可以使用 glob 或者简单的 os.listdir
-
我知道要搜索,我正在寻找最快的方法,不。的文件几乎有 50 万,分布在每个目录中..
-
@jolindbe 我不认为那是我正在寻找你提到的链接..请再次检查我的问题...
-
如果你举一个更具体的例子可能会有所帮助。显示
A中的一些文件、B中的一些文件的示例,以及您期望的结果和原因。