【发布时间】:2022-01-24 01:04:45
【问题描述】:
我需要创建一个新列,用于在分隔列表中建立实体之间的关系(除逗号之外的任何分隔符都有效)。
数据框:
df1 = pd.DataFrame(np.array([[1000, 'Jerry', 'BR1','BR1'],
[1001, 'Sal', 'BR2', 'BR1'],
[1002, 'Buck', 'BR3', 'BR2'],
[1003, 'Perry','BR4','BR1']]),
columns=['ID', 'Name', 'Branch', 'Member of'])
最终结果应该是:
ID Name Branch Member of Members
==== ==== ====== ========= =======
1000 Jerry BR1 BR1 Jerry, Sal, Perry
1001 Sal BR2 BR1 Buck
1002 Buck BR3 BR2 NaN
1003 Perry BR4 BR1 NaN
我需要通过在“成员”中查找所有匹配项来创建“成员”列,但返回“名称”,然后填充以“成员”结尾的列表。
np.where 是个不错的起点吗?
np.where(df['Branch'] == df['Member of'], ??, np.nan)
【问题讨论】: