【发布时间】:2017-03-08 20:45:56
【问题描述】:
我需要使用Cassandra来存储一个倒排索引,其中的单词及其在文章中出现的频率存储如下:
word, article_title, frequency
唯一词数约为 40M,Cassandra 节点数 = 2。 使用单词的第一个字符作为分区键或单词本身哪个更好? 主键呢?
【问题讨论】:
-
很难说不知道该表将服务的查询。
-
查询是这样的:select * from reverse_index which word in (word1, word2, ...);
-
你看过 sasi 索引吗?
-
我只是看着他们。其实我认为我不需要创建索引