【发布时间】:2017-11-14 22:28:12
【问题描述】:
n1 = DataFrame({'zhanghui':[1,2,3,4] , 'wudi':[17,'gx',356,23] ,'sas'[234,51,354,123] })
n2 = DataFrame({'zhanghui_x':[1,2,3,5] , 'wudi':[17,23,'sd',23] ,'wudi_x':[17,23,'x356',23] ,'wudi_y':[17,23,'y356',23] ,'ddd':[234,51,354,123] })
上面的代码定义了两个 DataFrame 对象。我想使用 n1 中的“zhanghui”字段和 n2 中的“zhanghui_x”字段作为“on”字段合并 n1 和 n2,所以我的代码如下:
n1.merge(n2,how = 'inner',left_on = 'zhanghui',right_on='zhanghui_x')
然后给出这样的结果列:
sas wudi_x zhanghui ddd wudi_y wudi_x wudi_y zhanghui_x
出现了一些重复的列,例如“wudi_x”、“wudi_y”。 所以这是熊猫内部的问题,还是我对 pd.merge 的用法有误?
【问题讨论】:
-
请发布所需的输出,这是预期的行为,因为您的行值不相同,因此它将冲突的值添加为新的 x 和 y 列
标签: pandas merge duplicates