【发布时间】:2017-12-26 09:19:47
【问题描述】:
我正在尝试使用 Avalanche 混合器来散列整数坐标。我一直在使用Murmur3's 32 位和 64 位雪崩混频器来这样做(而不是实际的总哈希函数)。对于我的应用程序,不需要整个哈希函数,只需要这里看到的 Avalanche Mixer:
uint32_t murmurmix32( uint32_t h )
{
h ^= h >> 16;
h *= 0x85ebca6b;
h ^= h >> 13;
h *= 0xc2b2ae35;
h ^= h >> 16;
return h;
}
uint64_t murmurmix64( uint64_t h )
{
h ^= h >> 33;
h *= 0xff51afd7ed558ccdULL;
h ^= h >> 33;
h *= 0xc4ceb9fe1a85ec53ULL;
h ^= h >> 33;
return h;
}
这些在我的机器上看起来很快,我将两个 uint32_ts 混合到这些函数中以产生雪崩结果,这会产生我喜欢的伪随机分布。
我想为这个系统引入更多坐标(即 z 和 w),所以我想使用更大的雪崩混合器来散列我的坐标。我相信出于我的目的,我希望从函数本身中看到的最大值是 uint64_t,碰撞本身不是问题,但结果的随机性是。
似乎 murmur3 的雪崩混合器没有比 64 更大。我查看了 this website 和 this one 以获得一些关于一些替代雪崩哈希的线索:
这些雪崩的质量似乎足以满足我的申请,但我对 City hash 的杂音灵感特别感兴趣。
在 CityHash 中,他们有一个“杂音灵感”的混音器:
uint64 Hash128to64(const uint64_t& x_high, const uint64_t& x_low) {
// Murmur-inspired hashing.
const uint64 kMul = 0x9ddfea08eb382d69ULL;
uint64 a = (x_low ^ x_high) * kMul;
a ^= (a >> 47);
uint64 b = (x_high ^ a) * kMul;
b ^= (b >> 47);
b *= kMul;
return b;
}
这对于两个 64 位数字来说似乎相当快。我对他们如何从 Murmur 中获得自己的“灵感”哈希感到困惑。如何创建自己的 2^n 位杂音雪崩混频器?
【问题讨论】:
-
我认为它需要大量的实验。您需要进行一些可逆的转换(例如与奇数相乘,与自身右移异或等),然后将它们按某种顺序排列,然后测量雪崩。注意:如果我没记错的话,你的噪音发生器需要这个。在这种情况下,你的输出比你的输入少,所以这些通用哈希函数做的太多了。所以也许你可以找到一个更简单一点的哈希函数,它只对低 X 位具有良好的雪崩特性。
-
@geza 是的,我需要这个来消除噪音。对于我正在查看的尺寸,我还没有找到任何更简单的雪崩混合器。目前我正在使用 murmur 3,它运行良好且速度很快,murmur 似乎是我能管理的最快并且仍然获得良好的雪崩行为。
标签: c++ random hash murmurhash