【发布时间】:2021-10-30 07:31:05
【问题描述】:
我正在尝试比较两个 spark 数据帧以从两个数据帧中找到不匹配的值,但我只得到不匹配的 df1 值。我需要连接 df1 和 df2 的不匹配值。
df1 = spark.read.load("df1.csv", format = "csv", header = "True")
df2 = spark.read.load("df2.csv", format = "csv", header = "True")
sss = df2.subtract(df1)
=================== df1 和 df2 ===================
代码输出:
提前致谢。
【问题讨论】:
-
列 col1、col2 和 col3 在预期输出中是相同的。为什么需要包含相同的列?