【问题标题】:Using MD5 checksum to uniquely address a binary content in DB使用 MD5 校验和对 DB 中的二进制内容进行唯一寻址
【发布时间】:2013-12-23 09:37:42
【问题描述】:

我需要将二进制文件(图像和 pdf)从一个环境转移到另一个环境。 这些二进制文件在主要文档中被引用,主要是 HTML Doc 作为 Title 和 Version No: 。 问题是我们有版本控制,因此 HTML DOC 可能会重新读取到 img src=(Logo1 + Version 2)。标题对我有好处,但版本是系统生成的,供主机系统使用。

我需要将 HTML Doc 带到另一个系统 - 我当然可以插入 Logo assosiated - 我不想只插入图像(或 pdf),如果它已经在目标系统中可用。我可以使用 Title + MD5 Checksum 的组合来检查目标系统是否已经具有相同的内容,可能具有不同的版本号:。我认为这种方法发生碰撞的可能性很小?我们的文档管理系统中存储了 Md5

【问题讨论】:

    标签: hash md5


    【解决方案1】:

    发生冲突的几率取决于您必须存储的文档数量,但应该足够低。

    但这假设没有人真正尝试创建碰撞。 MD5 被认为是损坏的,所以如果有人可以从你的冲突中受益,他/她可能会拉出来。

    因此,我建议使用更安全的哈希函数。使用哪一个对您的努力没有太大影响。

    另请参阅此问答:What is the clash rate for md5?

    【讨论】:

    • 它相对较小的说法最多以千份文件为单位。感谢链接到 Md5 的冲突率。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-04-01
    • 1970-01-01
    • 2011-05-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多