【问题标题】:Cassandra data not distributed evenlyCassandra 数据分布不均
【发布时间】:2017-06-02 09:37:05
【问题描述】:

我有一个 3 节点集群,复制因子为 3。nodetool status 显示一个节点有 100gb 的数据,另一个 90gb 和另一个 30gb。每个节点拥有 100% 的数据。

我使用一个唯一的 url 作为我的集群键,所以我想数据应该均匀分布。即使这样,由于 RF 是 3,所有节点都应该包含相同数量的数据。有什么想法吗?

谢谢。

【问题讨论】:

  • 你的表的分区键是什么?
  • 您有 3 个节点,并且所有密钥空间的 RF 为 3?为什么?
  • 分区键是唯一的url。我正在使用一个简单的主键。

标签: cassandra


【解决方案1】:

正在使用的写入一致性级别是什么?我猜它可能是“一致性一”,因此数据最终会被复制。特别是如果数据是一次性转储的。以后尽量使用“consistency local_quorum”来避免这个问题。

尝试运行“nodetool repair”,它应该会使所有节点中的数据恢复同步。

记住,来自“cqlsh”的写入默认使用“一致性一”。

【讨论】:

  • 写入是法定人数。一个节点确实出现了一段时间。我跑了nodetool repair,但没有任何改变。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2013-08-05
  • 2019-05-01
  • 1970-01-01
  • 1970-01-01
  • 2015-01-18
  • 2019-04-02
  • 1970-01-01
相关资源
最近更新 更多