【发布时间】:2020-05-25 07:59:00
【问题描述】:
我看到 clickhouse 为每个分区键创建了多个目录。
Documentation says目录名格式为:分区名、最小数据块数、最大数据块数和块级别。例如,目录名称为201901_1_11_1。
我认为这意味着该目录是属于分区201901的一部分,具有从1到11的块并且在1 级。所以我们可以有另一部分,其目录类似于201901_12_21_1,这意味着这部分属于分区201901,有从12到21的块> 并且在级别 1。
所以我认为分区被分成不同的部分。 我说的对吗?
【问题讨论】:
-
Not - 分区不拆分为部分,分区是从部分中收集的。最初部分由 INSERT 生成(因此遵循insert rule 非常重要)并定期合并为几个大部分(理想情况下每个分区只有一个部分)。看这个解释:github.com/ClickHouse/ClickHouse/issues/…
-
@vladimir 感谢您的回复。根据您的回答,在一个零件目录中,我们可以有多个分区,每个分区在零件目录中都有自己的目录。而当我们读取数据时,我们需要检查零件中的每个分区范围来选择读取哪个。我理解的对吗?
标签: clickhouse