【发布时间】:2012-08-02 19:41:14
【问题描述】:
我想测试第 3 方(包括“闭源”)工具(如同步、重复数据删除...)在存在具有相同大小和摘要校验和(流行的 CRC32、MD5、SHA- 1 ...等)。 其中一些散列方法具有已知的漏洞,因此存在产生冲突的方法。
您知道此类数据集的来源(除蛮力尝试创建一些 :))或用于创建此类的生成器吗?
为了澄清这一点:我对具有相同校验和、文件大小但内容不同的文件集感兴趣!
【问题讨论】:
-
字典、日志文件、源代码,一切顺利……
-
我不要求“任何东西”。我要求碰撞,因为它们很难生成。
-
它们很难生成,因为函数接近最优且密钥空间足够大。记住生日悖论:一旦你对 sqrt(n) 对象进行了测试和散列,观察到 one 碰撞的机会大约为 1。对于 256 位密钥,将插入 2^^128 个对象。有两种可能性:1)减少密钥空间(比如 32 位)或 2)有坚实的数学基础。这就是你所能做的。
-
没错。但其中一些,如 md5、sha1 已损坏。你所说的@wildplasser 是我要求数据集的原因。
-
您是在测试自己构建的工具还是第三方程序?
标签: collision-detection checksum redundancy hash-collision