【问题标题】:Spark HBase to Google Dataproc and Bigtable migrationSpark HBase 到 Google Dataproc 和 Bigtable 的迁移
【发布时间】:2018-05-26 23:50:10
【问题描述】:

我在 AWS EMR 集群上运行 HBase Spark 作业。最近我们搬到了 GCP。我将所有 HBase 数据传输到 BigTable。现在我在 Dataproc 中运行相同的 Spark - Java/Scala 作业。 Spark 作业失败,因为它正在查看 spark.hbase.zookeeper.quorum 设置。

请告诉我,我如何在不更改代码的情况下使用 BigTable 使我的 spark 作业成功运行。

问候, 尼拉吉·维尔马

【问题讨论】:

标签: google-cloud-platform google-cloud-dataproc bigtable google-cloud-bigtable


【解决方案1】:

虽然 BigTable 与 HBase 共享相同的原理并且相同的 Java API 可用,但它不共享其有线协议。所以标准的 HBase 客户端不起作用(zookeeper 错误看起来你正试图通过 HBase 客户端连接到 BigTable)。相反,您需要修改程序以使用BigTable-specific client。它实现了与 HBase 相同的 Java 接口,但需要在类路径中使用自定义 google jar,并且需要很少的属性覆盖才能启用它。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-08-20
    • 1970-01-01
    • 2020-03-01
    • 1970-01-01
    • 2015-12-21
    • 1970-01-01
    相关资源
    最近更新 更多