【发布时间】:2015-09-27 08:22:49
【问题描述】:
我正在使用 Spark 1.3、HBase 1.1 和 Phoenix 4.4。我的代码中有这个:
val dataframe = sqlContext.createDataFrame(rdd, schema)
dataframe.save("org.apache.phoenix.spark", SaveMode.Overwrite,
Map("table" -> "TEST_SCHEMA.TEST_HTABLE", "zkUrl" -> zkQuorum))
CREATED_DATE 在数据框中始终设置为 DateTime.now()。
如果 HBase 中已存在该行,但其他字段中有更新,我不希望更新该字段。
我可以使用 HBase 的 checkAndPut 来实现它:放置所有字段并在 created_date 字段上使用 checkAndPut。
但是如何使用 Phoenix-Spark API 做到这一点?我应该改用 HBase API 吗?
【问题讨论】:
-
如果您有关于 phoenix spark 集成的高级问题,我建议您加入 Phoenix 邮件列表。回答这类问题的人要多得多。
-
当我试图在那里发布我的问题时,它打开了我的邮件 (To:user@phoenix.apache.org),我收到了一封来自 Apache Mailer-daemon -fail 的回复邮件。
-
您订阅了邮件列表吗?在向它发送电子邮件之前,您需要订阅它。
标签: hadoop apache-spark hbase phoenix