【问题标题】:Evaluate minimal storage disk size with Cassandra使用 Cassandra 评估最小存储磁盘大小
【发布时间】:2016-08-27 12:48:02
【问题描述】:

我正在对不同 Parquet 模式和不同 Cassandra 表布局进行分析/比较。

其中一个输出是磁盘上的存储大小。

我想确保我对 Cassandra 公平,因此我想确保删除快照并且“完全”运行压缩。

我的数据最初在 Parquet 中,我使用 Spark SQL 读取它,有一个大数据框,然后我使用 Spark-Cassandra 连接器将其写入 C*。

我应该运行什么类型的“命令”(我假设使用 nodetool)来删除快照、运行压缩,然后在我的表的磁盘大小上获得一个精确的数字?

【问题讨论】:

    标签: cassandra apache-spark-sql


    【解决方案1】:

    你必须执行nodetool clearsnapshot

    此命令仅删除nodetool 命令指向的节点中的快照。所以你必须在每个节点上都这样做。

    https://docs.datastax.com/en/cassandra/3.x/cassandra/tools/toolsClearSnapShot.html

    https://docs.datastax.com/en/cassandra/3.x/cassandra/operations/opsBackupDeleteSnapshot.html?hl=clearsnapshot

    【讨论】:

    • 谢谢,确实是第一步。如何确保压实全部完成?就像运行nodetool compactionstats一样简单?
    • 确保压缩完成的唯一方法是执行nodetool compact 命令。
    猜你喜欢
    • 2014-09-12
    • 1970-01-01
    • 2017-11-11
    • 2012-08-01
    • 2012-09-13
    • 2012-06-27
    • 1970-01-01
    • 2015-10-09
    • 2011-05-17
    相关资源
    最近更新 更多