【发布时间】:2014-01-02 22:08:45
【问题描述】:
给定一个存储 ID 和 Blob 的简单 CQL 表,存储潜在的数十亿行是否存在任何问题或性能影响?
我知道在早期版本的 Cassandra 中,宽行是必需的,但 CQL 似乎鼓励我们放弃这一点。我没有任何特殊要求来确保数据聚集在一起或能够以任何顺序过滤。我想知道 CQL 表中的很多行是否会以任何方式出现问题。
我正在考虑对我的数据进行分箱,即 - 创建一个分区键,它是 ID 的哈希 %n,并将数据限制为 n 'bins'(数百万?)。在添加该开销之前,我想验证它是否真的值得。
【问题讨论】: