【发布时间】:2020-05-11 10:17:55
【问题描述】:
我在 Java Spark 中有两个数据集,如下所示:
我想获得一个连接的数据集,其中有两个数据集的所有键以及'val1'和'val2'两列,如果缺少一个则为null,像这样
我尝试过使用全外连接:
ds1.join(ds2,col("key1").equalTo(col("key")), "fullouter")
但它仅在 key1 set 等于 key2 set 时才有效。
【问题讨论】:
标签: java apache-spark dataset