cassandra 磁盘空间使用情况答案

【问题标题】：cassandra disk space usagecassandra 磁盘空间使用情况
【发布时间】：2014-07-29 16:10:03
【问题描述】：

问题：我们cassandra的数据库占用了很多磁盘空间。估计的数据大小约为 10 Gb，而占用的磁盘空间约为 100 Gb。我们做了很多写入/删除。我们有两个节点。

这是我们尝试做的事情（按完成的顺序）：

有人可以帮忙吗？我们接下来应该做什么？ :)

【问题讨论】：

您使用的是哪个版本的 casssandra？你如何将数据加载到 cassandra 中？你做了多少删除操作？从 cassandra 中删除 gc_grace 为零的数据后，您是否尝试过两次运行压缩？
- 我们使用 cassandra v1.1.2 - 我们使用这样的 hector 客户端（请参阅下面的答案）- 我们执行大约 200 次保存/分钟和 200 次删除/分钟的平均大小为 2mb 的二进制文档-我们没有使用 gc_grace=0 删除。我们先删除它们，然后将 gc_grace 设置为 0，运行修复（2 个节点中的 1 个成功）并运行压缩。

【解决方案1】：

我在使用 Cassandra 2.0.9 时遇到了类似的问题。

通过在每个节点上使用nodetool clearsnapshot，我成功地清理了硬盘上的空间。可以仅删除指定列族的快照。可以在here找到有关nodetool实用程序的详细信息。

【讨论】：