【发布时间】:2017-08-08 03:25:30
【问题描述】:
我有一个数据框 df1,其中包含两列“ids”和“names”-
ids names
fhj56 abc
ty67s pqr
yu34o xyz
我有另一个数据框 df2,其中一些列是 -
user values
1 ['fhj56','fg7uy8']
2 ['glao0','rt56yu','re23u']
3 ['fhj56','ty67s','hgjl09']
我的结果应该给我那些来自 df2 的用户,其值包含至少一个来自 df1 的 id,并且还告诉哪些 id 负责将它们放入结果表中。结果应该看起来像 -
user values_responsible names
1 ['fhj56'] ['abc']
3 ['fhj56','ty67s'] ['abc','pqr']
用户 2 没有出现在结果表中,因为它的值都不存在于 df1 中。
我试图这样做 -
df2.query('values in @df1.ids')
但这似乎效果不佳。
【问题讨论】:
-
您需要取消嵌套您的列
values