【发布时间】:2014-11-27 12:10:41
【问题描述】:
我已经在集群上设置了 Cassandra。我已经在同一个集群上设置了 Hadoop。他们都单独工作正常。抛开架构不谈,如何整合两者? .xmls应该放在哪个配置?
从我读过的小文档来看,我认为我需要一个提供cfs:/// 方案的类,对吧? CFS 应该替代 HDFS 吧?
我设法找到的所有文档要么过于抽象,要么过时,要么两者兼而有之,甚至官方文档也是如此。我正在使用 Casandra 2.1.0 和 Hadoop 2.5.1。
【问题讨论】:
-
您是否希望 hadoop 工具使用 cassandra 而不是 hdfs?如果您正在 cassandra 之上寻找类似 Hadoop 的功能,请查看 Apache Spark。 Spark 也在 hadoop 之上运行,并打开了许多大门。
-
我认为 Hadoop 更适合我们的用例,不过我会检查一下。
标签: hadoop configuration cassandra integration