【发布时间】:2018-04-03 10:04:57
【问题描述】:
这可能是一个非常基本的问题,但我想知道要在 Hive 和 HBase 中使用查询,我们是否需要一个正在运行的 Hadoop 集群?
我想使用 Hive 或 HBase 和 AWS S3 存储来存储我的数据,但想知道我是否需要我的集群一直运行才能运行查询,因为这会产生成本?
【问题讨论】:
这可能是一个非常基本的问题,但我想知道要在 Hive 和 HBase 中使用查询,我们是否需要一个正在运行的 Hadoop 集群?
我想使用 Hive 或 HBase 和 AWS S3 存储来存储我的数据,但想知道我是否需要我的集群一直运行才能运行查询,因为这会产生成本?
【问题讨论】:
Hive 不,HBase 是的,因为它需要“真正的文件系统”。 AWS EMR 已经对他们的 HBase 版本做了一些“事情”来解决这个问题,但他们没有与开源代码共享这项工作,所以你只能通过 EMR 获得它
【讨论】: