【发布时间】:2020-09-19 17:10:51
【问题描述】:
我计划在 ClickHouse 中重新设计表,以避免在使用 ReplicatedReplacingMergeTree 时出现一些性能和重复数据删除/版本控制问题。在这里,可以运行 OPTIMIZE FINAL 来删除重复项,但不能连续运行。
因此,我们计划保留一个表 A,每天对传入的数据进行分区。 然后是一个按月分区的表 B,用于存储历史数据。 查询将被定向到包含两者的 MERGE 表(不是 MergeTree)。
然后,我们设置了一个动作,将最新的分区从 A 移动到 B,每天结束后。
但是,移动分区就像MOVE PARTITION TO TABLE 中声明的“两个表必须具有相同的分区键。”,这是不可能的。 一种方法是将数据从 A 的日常分区复制到 B,然后分离/删除 A 中的日常分区。但是同时我们会看到重复。
在影响最小的情况下将此数据从 A 传输到 B 的最佳方法是什么?还有哪些选择?
【问题讨论】:
标签: clickhouse