【发布时间】:2020-04-14 23:50:42
【问题描述】:
我是 Cassandra 的新手,我被困在某一点上。
假设我有一个 RF=1 的 5 节点集群(为简单起见)
Token Ranges
==============
N1 : 1-100
N2 : 101-200
N3 : 201-300
N4 : 301-400
N5 : 401-500
我有一个包含 10 个分区键的键空间:
ID (PartitionKey) | Name
------------------------
1 Joe
2 Sarah
3 Eric
4 Lisa
5 Kate
6 Agnus
7 Lily
8 Angela
9 Rodger
10 Chris
10 个分区键 ==> 意味着 ==> 10 个哈希值
partitionkey ==> token generated
=================================
1 289 (goes on N3)
2 56 (goes on N1)
3 78 (goes on N1)
4 499 (goes on N5)
5 376 (goes on N4)
6 276 (goes on N3)
7 2 (goes on N1)
8 34 (goes on N1)
9 190 (goes on N2)
10 68 (goes on N1)
如果是这样的话,那么:
N1 has the partition keys : 2,3,7,8,10
N2 has the partition keys : 9
N3 has the partition keys : 1,6
N4 has the partition keys : 5
N5 has the partition keys : 4
所以我们看到 N1 与其他节点相比已加载(根据我的理解)。
请帮助我了解数据在 Cassandra 中是如何均匀分布的,w.r.t 分区器和一致性哈希。
【问题讨论】:
标签: cassandra