【问题标题】:Pandas Parsing by cellPandas 按单元格解析
【发布时间】:2021-05-24 15:37:12
【问题描述】:
我有一个包含 n 列和 n 行的数据框。一些单元格包含多个值,由“;”分隔我不知道如何遍历数据框中的每个单元格,以及如果遇到这种情况将单元格分成多个单元格。
上面的图片在谷歌表格中,但我需要一个熊猫数据框的解决方案。
提前感谢任何帮助谢谢:)
【问题讨论】:
标签:
python
pandas
database
dataframe
data-cleaning
【解决方案1】:
df:
1 2 3 4
a;b;d; a;b g;a a
c;f f e g
e d
尝试通过explode:
exploded = [df[col].str.rstrip(';').str.split(';').explode().reset_index(drop=True) for col in df.columns]
df2 = pd.DataFrame(dict(zip(df.columns, exploded)))
df2:
1 2 3 4
0 a a g a
1 b b a g
2 d f e None
3 c d None NaN
4 f NaN NaN NaN
5 e NaN NaN NaN