【发布时间】:2020-08-07 14:19:59
【问题描述】:
我有两个需要合并的数据框。第一个是:
page value
shoes 554
sneakers 226
sandals 114
boots 821
T-shirt 213
mobile-phone 284
laptop 361
第二个数据框是:
path1 path2 path3 path4
fashion footwear shoes-and-other shoes
fashion footwear shoes-and-other sneakers
fashion footwear sandals NaN
fashion footwear shirts T-shirt
electronic devices mobile-and-tablet mobile-phone
electronic devices laptop NaN
我的预期输出将是:
path1 path2 path3 path4 page value
fashion footwear shoes-and-other shoes shoes 554
fashion footwear shoes-and-other sneakers sneakers 226
fashion footwear sandals NaN sandals 114
fashion footwear shirts T-shirt T-shirt 213
electronic devices mobile-and-tablet mobile-phone mobile-phone 284
electronic devices laptop NaN laptop 361
如果第一个数据帧中的任何page 字符串存在于第二个数据帧的path1 或path2,或path3,或path4 列中,我想加入这两个数据帧.请注意,第一个数据帧的page 可能与第二个数据帧的path1 匹配,我有多种情况。
有没有简单的pythonic方式?
【问题讨论】:
-
你的预期输出是什么。
-
@Erfan 我已经编辑了我的问题。
-
看起来大多数键都在
path4中,如果缺少值,它们会出现在path3中,您的实际数据是否相同? -
不,正如我所写,
page字符串也可能在path1或path2中找到。但匹配不是部分的,page的值恰好写在一些path变量中。
标签: python pandas dataframe join merge