【问题标题】:cassandra disk space usagecassandra 磁盘空间使用情况
【发布时间】:2014-07-29 16:10:03
【问题描述】:

问题:我们cassandra的数据库占用了很多磁盘空间。估计的数据大小约为 10 Gb,而占用的磁盘空间约为 100 Gb。我们做了很多写入/删除。我们有两个节点。

这是我们尝试做的事情(按完成的顺序):

  1. 在两个节点上运行压缩 - 已完成,但效果为零
  2. 将 gc_grace 设置为 0。
  3. 在两个节点上运行修复 - 一个节点成功,另一个修复“挂断” - 它还活着,但持续了 3 天,之后我们将其切断。
  4. 在两个节点上运行压缩 - 已完成,但效果仍然为零。

有人可以帮忙吗?我们接下来应该做什么? :)

【问题讨论】:

  • 您使用的是哪个版本的 casssandra?你如何将数据加载到 cassandra 中?你做了多少删除操作?从 cassandra 中删除 gc_grace 为零的数据后,您是否尝试过两次运行压缩?
  • - 我们使用 cassandra v1.1.2 - 我们使用这样的 hector 客户端(请参阅下面的答案)- 我们执行大约 200 次保存/分钟和 200 次删除/分钟的平均大小为 2mb 的二进制文档-我们没有使用 gc_grace=0 删除。我们先删除它们,然后将 gc_grace 设置为 0,运行修复(2 个节点中的 1 个成功)并运行压缩。

标签: garbage-collection cassandra


【解决方案1】:

我在使用 Cassandra 2.0.9 时遇到了类似的问题。

通过在每个节点上使用nodetool clearsnapshot,我成功地清理了硬盘上的空间。可以仅删除指定列族的快照。可以在here找到有关nodetool实用程序的详细信息。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-10-07
    • 1970-01-01
    • 2013-11-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-10-24
    相关资源
    最近更新 更多