【问题标题】:HBase Column family localityHBase 列族位置
【发布时间】:2019-02-01 23:34:07
【问题描述】:

在五台服务器上有 HBase,其中一张表包含一列 Family,我应该对每个键执行一些 map 任务并保存结果。 主要问题是:

保持数据局部性哪个更好:在现有表上创建新列族或创建新表

以及下一个问题:

HBase 文档 建议保持低于三个列族,正如我所说,我有十多个 map 任务,并且会将每个结果保留在新的列族中。我该怎么办?因为每个map 任务都与另一个不同。 位置保留和搜索成本很重要。

【问题讨论】:

  • 您能否提供一个文档链接,该文档说明每个表有 3 个列族?
  • @AdamSkywalker,请考虑这个链接hbase.apache.org/1.2/book.html#number.of.cfs
  • 感谢您的链接。请注意,此建议主要是关于写入不同的 CF。对于阅读来说,它并不重要。

标签: hbase column-family


【解决方案1】:

哪个更好:在存在表上创建新的列族 或创建新表

我建议更多地关注表设计的架构和简单性,而不是尝试破解 HBase 内部结构以获得最佳性能。如果来自这 2 个列族的信息是相关的,并且您需要在 map-reduce 扫描中访问这两个 CF - 将它们保存在同一个表中。如果信息是 100% 独立的,并且您永远不需要同时扫描它们 - 将它们保存在不同的表中。同样,这是一个架构设计问题,不要尝试过早地进行优化。

第二个问题 - 我不明白你在说什么,抱歉。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-06-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-02-15
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多