【发布时间】:2022-01-02 00:41:37
【问题描述】:
我最近开始研究 Databricks,我一直在尝试找到一种方法来在 Delta 表上执行合并语句,尽管使用的是 R api(最好是 sparklyr)。最终目的是以某种方式施加“重复”约束,如here 所述。上述文档描述了 Python 工作流程:
deltaTable.alias("logs").merge(
newDedupedLogs.alias("newDedupedLogs"),
"logs.uniqueId = newDedupedLogs.uniqueId") \
.whenNotMatchedInsertAll() \
.execute()
但是,我想知道是否有一种直接的方法可以通过 R 实现这一目标。由于我是新用户(如上所述),因此我们将非常感谢任何关于此事的帮助/想法。 提前致谢!
【问题讨论】:
标签: r duplicates databricks sparklyr delta-lake