【发布时间】:2017-12-27 18:55:52
【问题描述】:
下面是我的场景:
- 最初使用 Sqoop 将数据加载到 HBASE(已完成)
- 现在,我将每天获得一批数据(大约 600000 条记录),这是新数据(用于将新记录插入 HBASE)和旧数据(用于更新 HBASE 现有记录)的组合。现在我的问题是:
如何使用 Spark/scala 到 Hbase 表执行此操作。
非常感谢您早日回复。
谢谢 苏维克
【问题讨论】:
-
您使用的是哪个 API(RDD、DataFrames、Datasets)和 Spark 版本?
-
嗨 Anton,我使用的是 spark 版本 1.6.1,API 是 dataframe。
-
如果您提供任何示例代码,那将真的对我有帮助。
标签: scala apache-spark hbase