【问题标题】:Why does MD5 Hash For FileStream and String Differ C#为什么文件流和字符串的 MD5 哈希值不同 C#
【发布时间】:2012-11-06 06:50:02
【问题描述】:

我使用 System.Security.Cryptography.MD5 从字符串和包含相同字符串的文件生成 MD5 哈希。但是哈希值不同。

这是从字符串生成的代码

byte[] data = Encoding.ASCII.GetBytes("The quick brown fox jumps over the lazy dog");
byte[] hash = MD5.Create().ComputeHash(data);
return BitConverter.ToString(hash).Replace("-", "").ToLower();

这是我从文件生成哈希时的代码

internal static string CalculateFileHashTotal(string fileLocation) 
    {
        using(var md5 = MD5.Create())
        {
            using (var stream = File.OpenRead(fileLocation))
            {
                byte[] b = md5.ComputeHash(stream);
                stream.Close();
                return BitConverter.ToString(b).Replace("-", "").ToLower();
            }
        }
    }

字符串中的哈希是正确的,所以我假设文件中的哈希读取了一些额外的内容或不读取整个文件。我在谷歌上找不到答案。

有什么想法吗?

【问题讨论】:

  • 为了提高散列的性能,将流包装在像var stream = new BufferedStream(File.OpenRead(path), 100000)这样的BufferedStream中

标签: c# md5 md5sum md5-file


【解决方案1】:

哈希不同是因为数据不同。

文件是 UTF-8,不是 ASCII,所以你应该使用 UTF-8 编码将字符串转换为字节以获得相同的结果:

byte[] data = Encoding.UTF8.GetBytes("The quick brown fox jumps over the lazy dog");

此外,该文件的开头可能包含BOM (byte order mark)。这包含在数据中,因为文件不是作为文本读取的。

在数据开头添加 UTF-8 BOM 会得到相同的哈希值:

byte[] bom = { 239, 187, 191 };
byte[] data = Encoding.UTF8.GetBytes("The quick brown fox jumps over the lazy dog");

byte[] bomdata = new byte[bom.Length + data.Length];
bom.CopyTo(bomdata, 0);
data.CopyTo(bomdata, bom.Length);
byte[] hash = MD5.Create().ComputeHash(bomdata);

【讨论】:

  • 谢谢。这如你所说。现在实际的问题是找出客户端将如何检查文件哈希。
【解决方案2】:

您是否从文件中删除了字符串中的空格和换行符?

【讨论】:

    猜你喜欢
    • 2017-06-04
    • 2016-07-27
    • 1970-01-01
    • 2018-11-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-05-17
    相关资源
    最近更新 更多