【发布时间】:2016-05-18 01:36:15
【问题描述】:
我在 pandas 数据框中的数据如下:
df1 = pd.DataFrame({'A':['yes','yes','yes','yes','no','no','yes','yes','yes','no'],
'B':['yes','no','no','no','yes','yes','no','yes','yes','no']})
所以,我的数据看起来像这样
----------------------------
index A B
0 yes yes
1 yes no
2 yes no
3 yes no
4 no yes
5 no yes
6 yes no
7 yes yes
8 yes yes
9 no no
-----------------------------
我想将其转换为另一个数据框。预期的输出可以显示在以下 python 脚本中:
output = pd.DataFrame({'A':['no','no','yes','yes'],'B':['no','yes','no','yes'],'count':[1,2,4,3]})
所以,我的预期输出是这样的
--------------------------------------------
index A B count
--------------------------------------------
0 no no 1
1 no yes 2
2 yes no 4
3 yes yes 3
--------------------------------------------
其实我可以通过下面的命令找到所有的组合并统计它们:mytable = df1.groupby(['A','B']).size()
但是,事实证明,这些组合在单个列中。我想将组合中的每个值分成不同的列,并为计数结果再添加一列。有可能这样做吗?我可以有你的建议吗?提前谢谢你。
【问题讨论】: