【发布时间】:2021-01-22 18:18:15
【问题描述】:
我有一个数据框df 和一个列df['table'],这样df['table'] 中的每个项目都是另一个具有相同标题/列数的数据框。我想知道是否有办法像这样处理groupby:
原始数据框:
name table
Bob Pandas df1
Joe Pandas df2
Bob Pandas df3
Bob Pandas df4
Emily Pandas df5
分组后:
name table
Bob Pandas df containing the appended df1, df3, and df4
Joe Pandas df2
Emily Pandas df5
我发现这段代码 sn-p 可以对数据帧中的字符串执行 groupby 和 lambda,但无法弄清楚如何将整个数据帧附加到 groupby。
df['table'] = df.groupby(['name'])['table'].transform(lambda x : ' '.join(x))
我也尝试过df['table'] = df.groupby(['name'])['HTML'].apply(list),但这给了我一个df['table'],而不是所有NaN。
感谢您的帮助!!
【问题讨论】:
标签: python pandas dataframe lambda pandas-groupby