【发布时间】:2019-02-28 14:48:15
【问题描述】:
我有三个节点的 Cassandra 集群。过去 4 年的数据接近 7 TB。现在由于服务器可用空间减少,我们希望仅保留最近 2 年的数据。但我们不想完全删除它(超过 2 年的数据)。我们希望保留超过 2 年的特定数据。 目前我可以想到一种方法: 1) Java 客户端使用“MutationBatch 对象”。我可以获得所有属于日期范围的记录键,并且不包括我们不想删除的行。然后批量删除记录。但由于数据量巨大,这种解决方案引发了对性能的担忧。
是否可以在服务器级别(opscenter)处理它。我阅读了有关 TTL 的信息,但如何将其应用于现有数据并限制一些我想要保留的数据,即使它超过 2 年。
请帮助我找出最佳解决方案。
【问题讨论】: