【问题标题】:how many partition is suitable per each node in cassandracassandra中每个节点有多少个分区是合适的
【发布时间】:2019-06-23 09:48:41
【问题描述】:

我正在测试 cassandra。 在服务器上设置我的 cassandra 节点之前。

我想知道每个节点有多少个分区是合适的。

  • 我计划每个分区保存 0~18000000 个数据。
  • 问:分区?????? / 1node ==> 稳定
如果不存在则创建表 access_log ( time_boundary int, --yyyymmddhh user_id 文本,--user01 时间戳 bigint,--yyyymmddhhmmssms url TEXT, -- /file/file/blabla~~ menu_id 文本, ip文本, 参数映射,- 主键((time_boundary),user_id,timestamp) ) ;

【问题讨论】:

  • 我计划为每个节点创建 25000 个分区
  • 请显示您的表架构和其他信息
  • 我为示例添加了我的表架构。

标签: cassandra nosql partition


【解决方案1】:

我认为一个安全的经验法则(很大程度上取决于架构和写入速率)是一个表(每个节点)中大约有 1-40 亿个分区,您开始使用2^20 max merkle 修复流式传输问题树的深度。

如果您使用的是 LeveledCompactionStrategy,您可以通过增量修复提高(仅建议在最新的 3.11.x 上进行,甚至在那里进行大量测试)。使用 SizeTieredCompactionStrategy ALTER TABLE yourtable WITH min_index_interval = 4096 and max_index_interval = 4096(或更高,如果您发现问题)来防止在压缩预分配索引摘要时出现 OOM。

【讨论】:

    猜你喜欢
    • 2011-06-14
    • 1970-01-01
    • 1970-01-01
    • 2017-06-01
    • 1970-01-01
    • 2017-02-04
    • 1970-01-01
    • 2018-10-20
    相关资源
    最近更新 更多