【发布时间】:2014-02-21 12:49:20
【问题描述】:
我一直在研究用于数据仓库的 NoSQL 和 Hadoop,但是我以前从未使用过这些技术,我想询问以下是否可以检查我是否正确理解了这些技术。
如果我将数据存储在 MongoDB 中,是否可以将 Hadoop 与 Hive 结合使用,直接对 MongoDB 进行 Hiveql 查询,并将这些查询的输出作为视图再次存储在 MongoDB 中,而不是 HDFS 中?
另外,如果我理解正确,大多数 NoSQL 数据库不支持连接和聚合,但可以通过 map-reduce 实现它们。如果当我在 HiveQL 中进行联接时 HiveQL 查询是 map-reduce 作业,它是否已经自动“加入”了 map-reduce 中的 MongoDB 数据,而无需担心 MongoDB 中缺乏对联接和聚合的支持?
【问题讨论】:
标签: mongodb hadoop hive hiveql nosql