【发布时间】:2019-01-12 11:53:21
【问题描述】:
如何有问题地(pyspark)sql MERGE INTO 语句可以实现。我有两个表,我使用 createOrReplaceTempView 选项将它们放入临时视图中。然后我尝试在这两个临时视图上使用 MERGE INTO 语句。但它失败了。原因可能是 SPARK SQL 不支持 MERGE。有人可以提示如何在 pyspark 中以编程方式实现一个简单的 MERGE INTO SQL 等效语句(如下所示)。
MERGE INTO events
USING updates
ON events.eventId = updates.eventId
WHEN MATCHED THEN
UPDATE SET
events.data = updates.data
WHEN NOT MATCHED
THEN INSERT (date, eventId, data) VALUES (date, eventId, data)
【问题讨论】:
-
嗨 Kaushik,没有直接的方法可以在 spark 中进行合并。虽然您可以使用案例方法在逻辑上使用普通 sql 来完成。
-
能否分享一个小例子代码
标签: sql merge pyspark apache-spark-sql