【发布时间】:2018-03-05 13:25:06
【问题描述】:
我有一个大小为 10 PB 的数据集。我当前的数据位于 HBase 中,我正在使用 Spark HbaseContext,但性能不佳。
在 Spark 上将数据从 HbaseContext 移动到 HiveContext 会有用吗?
【问题讨论】:
-
你从哪里得到
HbaseContext?它是 HBase 连接器的一部分,不是吗?如果是这样,您将无法仅在上下文之间切换,因为它们“不兼容”。