【发布时间】:2020-02-27 21:04:31
【问题描述】:
我想了解 elasticsearch 用于唯一计数的算法 (hyperloglog++)。
将精度阈值设置为特定值是否可以让我在不考虑内存限制的情况下准确地计算到该阈值?
算法是否使用线性计数器达到精度阈值,然后切换到超日志计数器?
【问题讨论】:
标签: elasticsearch elastic-stack
我想了解 elasticsearch 用于唯一计数的算法 (hyperloglog++)。
将精度阈值设置为特定值是否可以让我在不考虑内存限制的情况下准确地计算到该阈值?
算法是否使用线性计数器达到精度阈值,然后切换到超日志计数器?
【问题讨论】:
标签: elasticsearch elastic-stack
是的,它在哈希表中使用线性计数,直到精度阈值。你也可以在relevant code看到。
但请记住,默认精度阈值为 3,000,您最多可以将其设置为 40,000。设置更高的值实际上会将其上限设置为 40,000。所以对于更高的基数没有确切的结果。
【讨论】: