【发布时间】:2018-01-11 22:59:59
【问题描述】:
我在单机上使用相同的输入数据对 HDFS 和 Cassandra 的存储量进行了评估。 HDFS 和 Cassandra 都只有 1 个副本。 我的输入数据是二进制字节,总共31M。原来是 HDFS 的数据比 Cassandra 少。
HDFS : 16.4 M.(使用 COMPRESS.BLOCK 策略)(
-
卡桑德拉:50M。 (使用 CQL 接口,默认设置(例如压缩))
这怎么可能,因为 Cassandra 使用列式存储?
有人可以帮我解决吗?非常感谢。
我的 Cassandra 版本是 2.1.9。
【问题讨论】:
-
这是我输入数据的架构:10 个字段为长类型,2 个字段为字符串类型。和 Cassandra CQL 一样,bigint 有 9 个字段,text 有 2 个字段,timestamp 有 1 个字段
标签: cassandra compression hdfs