【发布时间】:2014-04-04 16:53:02
【问题描述】:
我有一个大约十亿行的巨大 HBase 表,其中包含大约 100 列(每行不同)的数据。
我想尽可能快地根据任何列限定符值查询此数据。
当我们知道 ROW-KEY 但我想根据不同的列值进行查询时,我知道 HBase 已针对快速读取进行了优化。但是应用列过滤器(使用 JAVA API)会导致全表扫描,从而减慢系统速度
我有什么选择?
- INDEXING:每行中的列都会发生变化。我还能做索引吗?
- 我是否继续使用 HBase 来存储数据?或者将它与 Solr 或 ElasticSearch 一起使用?
- 对于基于可能有十亿行的任何列值的随机查询,我可以获得什么样的性能?
欢迎提出其他建议。
【问题讨论】:
标签: solr indexing elasticsearch hbase real-time