【问题标题】:How to combine two dataset into one in Pyspark如何在 Pyspark 中将两个数据集合并为一个
【发布时间】:2020-02-21 08:21:54
【问题描述】:

假设我们有两个数据集:

数据集 1:

id  name    
1   James
2   Tom

数据集 2:

id   name
1    Bond
2    Jerry

我想要以下格式的数据集 3

数据集 3:

id   name
1    James
2    Tom
3    Bond
4    Jerry

提前致谢!!

【问题讨论】:

标签: pyspark


【解决方案1】:

相当简单,

df3 = df1.union(df2)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-11-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-12-29
    • 2012-12-16
    相关资源
    最近更新 更多