【发布时间】:2019-02-01 23:34:07
【问题描述】:
在五台服务器上有 HBase,其中一张表包含一列 Family,我应该对每个键执行一些 map 任务并保存结果。
主要问题是:
保持数据局部性哪个更好:在现有表上创建新列族或创建新表?
以及下一个问题:
HBase 文档 建议保持低于三个列族,正如我所说,我有十多个 map 任务,并且会将每个结果保留在新的列族中。我该怎么办?因为每个map 任务都与另一个不同。 位置保留和搜索成本很重要。
【问题讨论】:
-
您能否提供一个文档链接,该文档说明每个表有 3 个列族?
-
@AdamSkywalker,请考虑这个链接hbase.apache.org/1.2/book.html#number.of.cfs
-
感谢您的链接。请注意,此建议主要是关于写入不同的 CF。对于阅读来说,它并不重要。
标签: hbase column-family