【发布时间】:2014-02-04 21:43:36
【问题描述】:
在 Hbase 中,我使用“app_name_ip_timestamp”之类的行键加载数据。但是会有很多这样的应用。所以本质上我每分钟收集大约 5 万个数据点。
如果我必须基于 ip 进行查询,我可以在行键上使用子字符串过滤器,但这是一个好方法吗? 无论如何,Cassandra 可以提供帮助吗? Cassandra 在这种情况下有什么优势? 如何使 HBase 适合我可以使用行键 subString 过滤器并执行范围扫描并在毫秒内检索结果的情况? 在即席查询和部分行键、范围扫描、聚合结果方面查询 cassandra 和 hbase 的主要区别是什么
【问题讨论】:
标签: hadoop nosql cassandra hbase