【发布时间】:2019-06-06 17:17:30
【问题描述】:
虽然 Cassandra 允许 -2^63 到 +2^63-1 的分区数,但有没有推荐的最大分区数,超过这个数可能会影响性能?
【问题讨论】:
-
分区基于一致的散列,所以理想情况下不应该有任何性能损失。
标签: cassandra partitioning database-partitioning
虽然 Cassandra 允许 -2^63 到 +2^63-1 的分区数,但有没有推荐的最大分区数,超过这个数可能会影响性能?
【问题讨论】:
标签: cassandra partitioning database-partitioning
在每个节点大约 10 亿个分区之后,完全修复(非增量)开始出现非常严重的过度流问题。特别是对于较小的分区,因为验证压缩运行速度较慢。
理想情况下,我会通过分区 size 不计算来推荐它。大约 100mb 的分区,您将获得更有效的压缩,而不会在读取时分区索引的开销太大。我不会对它太严格,因为它在很多因素上都非常不稳定。尝试首先专注于为您的查询建模,然后如果所述模型最终具有太大或太多太小的分区(数亿或更多低于 1k 或任何多 gb ~ish - 每个节点不总数)
【讨论】: