【发布时间】:2016-02-20 22:51:53
【问题描述】:
在我的 lambda 架构中,我正在讨论是使用 HDFS 还是 Cassandra 来存储我的不可变数据。我需要 Cassandra 来处理在线请求等,所以它是技术栈的必需部分。现在,如果没有必要,我不想将新工具 (HDFS) 引入堆栈。所以我的问题是,如果我不使用 HDFS 并使用 Cassandra 来托管我的不可变数据,我会缺少什么。
编辑:
我了解 HDFS 是分布式文件系统,而 Cassandra 是 NoSQL DB。尽管如此,两者都支持数据复制,都支持高吞吐量写入。此外,Cassandra 支持低潜在数据检索。那么我是否正确地说 HDFS 不会为我提供太多提升?
【问题讨论】:
-
HDFS 是分布式文件系统,而不是数据库。我认为要问的“正确”问题是“HBase vs Cassandra?”,而不是“HDFS vs Cassandra?”
-
@MattBall 我知道这一点。查看我的编辑
-
抱歉,我没有看到修改...?
标签: cassandra hdfs lambda-architecture