【发布时间】:2010-10-03 22:43:30
【问题描述】:
我将在 python 上实现递归文件夹比较。你认为最好的算法是什么?
- 获取文件夹的两个文件列表
- 对两个列表进行排序
- 使用 filecmp 模块比较文件
- 递归地对每个文件夹重复
结果我只需要获取不同文件的列表(此处不需要内容差异),可比较文件夹之一中缺少的文件列表。
谢谢。
【问题讨论】:
我将在 python 上实现递归文件夹比较。你认为最好的算法是什么?
结果我只需要获取不同文件的列表(此处不需要内容差异),可比较文件夹之一中缺少的文件列表。
谢谢。
【问题讨论】:
对目录进行递归搜索,并为每个文件存储字典中文件的 md5 或 sha 校验和作为键,路径/名称作为值。为这两个目录制作这个字典。然后你可以从每个目录中删除对,结果是丢失/不同的文件。
这将制作简单的 O(n) 算法,其中 n 是目录的体积。
【讨论】:
【讨论】: