【发布时间】:2014-04-08 12:39:40
【问题描述】:
在 python/numpy 中,我有一个名为 random_matrix 的 10,000x10,000 数组。我使用 md5 来计算 str(random_matrix) 和 random_matrix 本身的哈希值。字符串版本需要 0.00754404067993 秒,numpy 数组版本需要 1.6968960762。当我将它变成 20,000x20,000 数组时,字符串版本需要 0.0778470039368 秒,而 numpy 数组版本需要 60.641119957 秒。为什么是这样? numpy 数组是否比字符串占用更多内存?另外,如果我想通过这些矩阵识别文件名,在计算哈希之前转换为字符串是一个好主意,还是有一些缺点?
【问题讨论】: