【发布时间】:2011-04-26 15:27:09
【问题描述】:
我遇到了一种情况,我必须计算字符串中每个单词的出现次数。我决定散列是最好的方法(找到遇到的每个单词的散列值,并在散列值索引的位置增加计数 - 假设我使用一个数组)。我可以使用什么哈希算法来确保为每个字符串生成的哈希值是唯一的?
这导致了一个更大的问题。语言库(例如 Java)如何实现像 hashmap 这样的数据结构,在字符串的情况下生成唯一的哈希值?
我想知道这种算法的实现背后所涉及的数学结构。
【问题讨论】:
-
code.google.com/p/gphfa 包含许多流行的字符串哈希算法。