【问题标题】:Recommended number of partitions in CassandraCassandra 中推荐的分区数
【发布时间】:2019-06-06 17:17:30
【问题描述】:

虽然 Cassandra 允许 -2^63 到 +2^63-1 的分区数,但有没有推荐的最大分区数,超过这个数可能会影响性能?

【问题讨论】:

  • 分区基于一致的散列,所以理想情况下不应该有任何性能损失。

标签: cassandra partitioning database-partitioning


【解决方案1】:

在每个节点大约 10 亿个分区之后,完全修复(非增量)开始出现非常严重的过度流问题。特别是对于较小的分区,因为验证压缩运行速度较慢。

理想情况下,我会通过分区 size 不计算来推荐它。大约 100mb 的分区,您将获得更有效的压缩,而不会在读取时分区索引的开销太大。我不会对它太严格,因为它在很多因素上都非常不稳定。尝试首先专注于为您的查询建模,然后如果所述模型最终具有太大或太多太小的分区(数亿或更多低于 1k 或任何多 gb ~ish - 每个节点不总数)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-05-15
    • 1970-01-01
    • 1970-01-01
    • 2023-03-03
    • 1970-01-01
    • 2022-06-10
    • 2012-07-27
    相关资源
    最近更新 更多