【发布时间】:2018-10-19 07:57:08
【问题描述】:
我有两个数据框 DF1 和 DF2,其中 id 作为唯一列, DF2 可能包含 DF1 现有记录的新记录和更新值,当我们合并两个数据框时,结果应该包括新记录,并且具有更新值的旧记录保持原样。
输入示例:
id name
10 abc
20 tuv
30 xyz
和
id name
10 abc
20 pqr
40 lmn
当我合并这两个数据框时,我希望结果为:
id name
10 abc
20 pqr
30 xyz
40 lmn
【问题讨论】:
标签: java scala apache-spark dataframe apache-spark-sql