【发布时间】:2021-12-01 09:20:51
【问题描述】:
我正在寻找对 PO Header Id 进行分组或(groupby),然后为 PO Header ID 相同的所有行连接字符串 (XML)。我偶然发现了一些代码示例,但遇到了一些错误。
最终,Final_XML 列是我想要实现的目标。
PO Header ID XML Combined_XML
123 <test1>
123 <test2>
456 <test3>
567 <test4>
567 <test5>
567 <test6>
Desired output
PO Header ID Combined_XML
123 <test1><test2>
456 <test3>
567 <test4><test5><test6>
这是我迄今为止尝试过的:
combineXML = df.groupby(['PO Header Id']).agg(['Combined_XML']).apply(list).reset_index()
print(combineXML)
Throws error: KeyError: 'PO Header Id' There are no spaces in the column name so I am not sure
why it is not working
df = df.groupby(['PO Header Id','XML'])['Combined_XML'].apply(''.join).reset_index()
【问题讨论】:
-
让我知道我的答案是否适合您,或者需要任何微调?谢谢!
-
嗨,斯科特,请反馈我的答案是否适合您,或者需要任何微调?谢谢!
标签: python pandas csv pandas-groupby data-science