【发布时间】:2016-01-10 06:31:41
【问题描述】:
我有以下问题:我有两个不同长度的 pandas 数据框,其中包含一些具有共同值和一些不同值的行和列,如下所示:
df1: df2:
Column1 Column2 Column3 ColumnA ColumnB ColumnC
0 a x x 0 c y y
1 c x x 1 e z z
2 e x x 2 a s s
3 d x x 3 d f f
4 h x x
5 k x x
我现在要做的是合并两个数据帧,这样如果 ColumnA 和 Column1 具有相同的值,则 df2 中的行将附加到 df1 中的相应行,如下所示:
df1:
Column1 Column2 Column3 ColumnB ColumnC
0 a x x s s
1 c x x y y
2 e x x z z
3 d x x f f
4 h x x NaN NaN
5 k x x NaN NaN
我知道合并是可行的
df1.merge(df2,left_on='Column1', right_on='ColumnA')
但此命令会删除两个文件中 Column1 和 ColumnA 中所有不相同的行。相反,我想将这些行保留在 df1 中,并在其他行具有来自 df2 的值的列中将 NaN 分配给它们,如上所示。在 pandas 中是否有一种流畅的方法来做到这一点?
提前致谢!
【问题讨论】:
标签: python pandas merge dataframe