【发布时间】:2017-03-01 00:51:16
【问题描述】:
我们目前正在构建一个新的 hbase 集群。架构如下:
现在我想添加一个新的 hive 集群。但我不知道是否应该在与 hbase 相同的 hadoop 集群上构建 hive。或者我应该为 hive 构建一个新的 hadoop 集群?
如果我为hive建立一个新的hadoop集群,当我执行SQL聚合hbase的数据时,hive和hbase之间的流量是否会太大(AFAIK,hive需要将hbase上的数据导入到自己的hdfs存储中)?
【问题讨论】: