【发布时间】:2016-05-27 12:58:40
【问题描述】:
在lesson material for datastax 的上下文中,给出这个问题:
在 RF=2 的 3 节点集群中,每个节点的总数据量是多少 节点自己的?
如何计算?
我想我找到了一种数学表达方式,但我认为我的数学技能充其量是很差的,而且它至少做出了一个假设——我不确定如何口头表达:
我可以用比例来表示:
节点/数据百分比
上面的例子看起来像这样:
1 (node) / x (data pct) = 3 (nodes total) / 100% (data pct)
3x = 100% ... x = 33.33%(乘以复制因子**)= 66.66%
因此,每个节点包含 2/3 的数据。
** 这是我知道的假设,我无法表达
我正在寻找健全性检查:此方法是否可以确定每个节点拥有的数据的 pct,其中“数据”定义为用户添加到 cassandra 的所有数据? (即,不是 opscenter)
如果是这样,这是否意味着在 RF=3 的 8 节点集群上,每个节点包含总数据的 37.5%?
我们的两个 dev c* 数据中心的服务器损失了一半,并且似乎能够恢复所有数据。我不确定如何验证这一点,但如果每个节点确实有 37.5% 的数据,那么它解释了我们如何能够完全恢复:这意味着 150% 的数据保留在四个节点上剩下的,假设复制在两个 c* dc 中都设置为 RF=3。 (就是用户添加的数据。)
【问题讨论】: