我们可以通过模仿 Boost 并结合哈希得到答案。
警告:组合散列,即从事物的许多散列中计算许多事物的散列,通常不是一个好主意,因为所得散列函数在统计意义上不是“好”的.许多事物的适当哈希应该从所有成分的整个原始数据构建,而不是从中间哈希构建。但目前还没有一个好的标准方法来做到这一点。
无论如何:
首先,我们需要hash_combine 函数。由于我无法理解的原因,它没有包含在标准库中,但它是其他一切的核心:
template <class T>
inline void hash_combine(std::size_t & seed, const T & v)
{
std::hash<T> hasher;
seed ^= hasher(v) + 0x9e3779b9 + (seed << 6) + (seed >> 2);
}
使用它,我们可以散列由可散列元素组成的所有内容,特别是对和元组(读者练习)。
但是,我们也可以通过散列容器的元素来使用它来散列容器。这正是 Boost 的“范围哈希”所做的,但使用 combine 函数可以直接实现。
编写完范围哈希器后,只需专门化 std::hash 即可:
namespace std
{
template <typename T, class Comp, class Alloc>
struct hash<std::set<T, Comp, Alloc>>
{
inline std::size_t operator()(const std::set<T, Comp, Alloc> & s) const
{
return my_range_hash(s.begin(), s.end());
}
};
/* ... ditto for other containers */
}
如果你想模仿漂亮的打印机,你甚至可以做一些更极端的事情,为所有容器专门化 std::hash,但我可能会更加小心,并为容器创建一个明确的哈希对象:
template <typename C> struct ContainerHasher
{
typedef typename C::value_type value_type;
inline size_t operator()(const C & c) const
{
size_t seed = 0;
for (typename C::const_iterator it = c.begin(), end = c.end(); it != end; ++it)
{
hash_combine<value_type>(seed, *it);
}
return seed;
}
};
用法:
std::unordered_map<std::set<int>, std::string, ContainerHasher<std::set<int>>> x;