【问题标题】:HiveQL in MongoDBMongoDB 中的 HiveQL
【发布时间】:2014-02-21 12:49:20
【问题描述】:

我一直在研究用于数据仓库的 NoSQL 和 Hadoop,但是我以前从未使用过这些技术,我想询问以下是否可以检查我是否正确理解了这些技术。

如果我将数据存储在 MongoDB 中,是否可以将 Hadoop 与 Hive 结合使用,直接对 MongoDB 进行 Hiveql 查询,并将这些查询的输出作为视图再次存储在 MongoDB 中,而不是 HDFS 中?

另外,如果我理解正确,大多数 NoSQL 数据库不支持连接和聚合,但可以通过 map-reduce 实现它们。如果当我在 HiveQL 中进行联接时 HiveQL 查询是 map-reduce 作业,它是否已经自动“加入”了 map-reduce 中的 MongoDB 数据,而无需担心 MongoDB 中缺乏对联接和聚合的支持?

【问题讨论】:

    标签: mongodb hadoop hive hiveql nosql


    【解决方案1】:

    MongoDB 确实对聚合类型的函数有很好的支持。当然没有连接。 MongoDB Schema 通常的设计方式是您通常不需要连接。

    HiveQL 在 HDFS 中的“表”上运行。这是默认行为。 但是你有一个 MongoDB-Hadoop 连接器:http://docs.mongodb.org/ecosystem/tools/hadoop/ 这将允许您从 Hadoop 中查询 MongoDB 数据。

    要使用 Map Reduce,您可以使用 MongoDB 本身(没有 Hadoop)来实现。 看到这个:http://docs.mongodb.org/manual/core/map-reduce/

    【讨论】:

      猜你喜欢
      • 2023-03-26
      • 1970-01-01
      • 2016-11-03
      • 2016-12-18
      • 1970-01-01
      • 1970-01-01
      • 2022-01-08
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多