【发布时间】:2014-07-29 16:10:03
【问题描述】:
问题:我们cassandra的数据库占用了很多磁盘空间。估计的数据大小约为 10 Gb,而占用的磁盘空间约为 100 Gb。我们做了很多写入/删除。我们有两个节点。
这是我们尝试做的事情(按完成的顺序):
- 在两个节点上运行压缩 - 已完成,但效果为零
- 将 gc_grace 设置为 0。
- 在两个节点上运行修复 - 一个节点成功,另一个修复“挂断” - 它还活着,但持续了 3 天,之后我们将其切断。
- 在两个节点上运行压缩 - 已完成,但效果仍然为零。
有人可以帮忙吗?我们接下来应该做什么? :)
【问题讨论】:
-
您使用的是哪个版本的 casssandra?你如何将数据加载到 cassandra 中?你做了多少删除操作?从 cassandra 中删除 gc_grace 为零的数据后,您是否尝试过两次运行压缩?
-
- 我们使用 cassandra v1.1.2 - 我们使用这样的 hector 客户端(请参阅下面的答案)- 我们执行大约 200 次保存/分钟和 200 次删除/分钟的平均大小为 2mb 的二进制文档-我们没有使用 gc_grace=0 删除。我们先删除它们,然后将 gc_grace 设置为 0,运行修复(2 个节点中的 1 个成功)并运行压缩。
标签: garbage-collection cassandra