【发布时间】:2012-06-29 13:57:41
【问题描述】:
我在 apache Cassandra 的大型博客处理项目中工作,但我想知道列族中的行是否太多。这会使我的查询变慢吗?
在我的数据中,我们每天有大约 1000 亿行日志
如果我将它们分成许多列族(如 20120627 之类的日模式)是更好的理想选择???
任何人都可以给我一个关于建模这些数据的建议吗?
我打算只创建这样的列族:
CREATE TABLE data (
KEY text PRIMARY KEY
) WITH
comment='log' AND
comparator=text
我想处理大块时间戳的数据(前处理:10:20 --> 10:30 数据)
【问题讨论】:
标签: nosql cassandra data-modeling