【发布时间】:2014-07-24 04:13:11
【问题描述】:
我对 Cassandra 中的集群感到有些困惑。我有一个非常重写入和重更新的应用程序。对于传统的关系数据库,我会将数据划分为两个表:一个表用于不经常更改的数据;另一个表用于存储不经常更改的数据。和一个表(行较短)用于频繁更改的列:
例如:
create table user_def ( id int primary key, email list< varchar > ); # stable
create table user_var ( id int primary key, state int ); # changes all the time
但 Cassandra 似乎针对访问稀疏的列进行了优化,所以我不确定在 Cassandra 模式中模仿这种方法是否有任何优势。
使用 Cassandra,将经常更新的列分离到单独的表/列族(远离不经常更新的列)是否有任何优势,或者我应该将所有列组合到一个表/列族中?如果我有一个复合主键并且集群开始发挥作用,情况会改变吗?
【问题讨论】:
标签: database-schema cassandra-2.0