【发布时间】:2018-05-26 23:50:10
【问题描述】:
我在 AWS EMR 集群上运行 HBase Spark 作业。最近我们搬到了 GCP。我将所有 HBase 数据传输到 BigTable。现在我在 Dataproc 中运行相同的 Spark - Java/Scala 作业。 Spark 作业失败,因为它正在查看 spark.hbase.zookeeper.quorum 设置。
请告诉我,我如何在不更改代码的情况下使用 BigTable 使我的 spark 作业成功运行。
问候, 尼拉吉·维尔马
【问题讨论】:
-
您是否尝试过将 hbase-site.xml 显式导出到 SPARK_CLASSPATH ?
-
@gruby 我的问题是,我需要避免使用 hbase,因为我想使用 Bigtable。那么 hbase-site.xml 中是否有任何我可以更改的设置以便我可以使用 Bigtable
-
您能否提供其他信息:您链接的 hbase 版本是什么?什么是完整的错误堆栈跟踪?什么版本的 Dataproc?
-
为了后人,我们在 google 群里讨论这个问题:groups.google.com/forum/#!topic/cloud-dataproc-discuss/…
标签: google-cloud-platform google-cloud-dataproc bigtable google-cloud-bigtable