【问题标题】:Retrieve rows in HBase with unique substring使用唯一子字符串检索 HBase 中的行
【发布时间】:2013-04-08 03:16:52
【问题描述】:

我需要根据特定列的值中的子字符串对 HBase 数据库中的行进行分组。

该列中的值的格式如下:

[text1]_[text2]_[text3]

例子:

row1: abc_aaa_ababab
row2: abc_aaa_cdcdcd  
row3: abc_bbb_fgfgfg  
row4: def_ccc_ababab  
row5: hij_ccc_jkjkjk

如何列出 [text2] 的所有可能值(例如 aaa、bbb 和 ccc)?

我没有必要一次性检索每一行的所有列。向用户呈现各种 [text2] 并且当他选择“bbb”时,仅检索具有“bbb”的行。我在想我可以使用 FuzzyRowFilter 来做后面的部分。

但我不确定如何列出 [text2] 的值。可以通过使用现有过滤器、自定义过滤器或其他方法来完成吗?

注意:数据库架构是由客户创建的 - 可以更改,但过程繁琐。因此,与使用概述的架构相比,重新设计架构的建议很有价值,但次要。

【问题讨论】:

    标签: hbase


    【解决方案1】:

    使用此架构将非常低效,因为您需要对每次搜索进行全表扫描。

    我会添加一个表,其中包含所有可能的子字符串到行 ID 的映射

    【讨论】:

      猜你喜欢
      • 2020-11-23
      • 1970-01-01
      • 2018-03-08
      • 1970-01-01
      • 1970-01-01
      • 2011-08-26
      • 2017-04-18
      • 1970-01-01
      • 2017-12-04
      相关资源
      最近更新 更多