【发布时间】:2020-09-05 15:17:40
【问题描述】:
您好,我正在尝试从多索引变量“df”中获取交叉表:
df.tail()
code X1 X2 X3
pays USA USA USA
desc phase phase phase
2020-01-01 a a a
2020-02-01 b c d
2020-03-01 a a b
2020-04-01 c a a
2020-05-01 d a d
我想得到类似的东西:
X1 X2 X3
a b c d a b c d a b c d
a
X1 b
c
d
a
X2 b
c
d
a
X3 b
c
d
在每个单元格中,我得到 (a,b,c,d) 的 Xi、Xj 值的数量/百分比
我试过了:
pd.crosstab(index = df, columns = df)
但我收到一条错误消息:
ValueError: Shape of passed values is (3, 2), indices imply (605, 2)
感谢您的帮助
【问题讨论】:
-
您的原始数据是否有 3 级列?
-
是的。我的 df 具有 3 个级别的多索引结构
-
填空你的预期输出
-
我想要一个列联表,即同时(a,a),(a,b)......对于每个(XI,Xj)的变量的数量/百分比
标签: pandas multi-index crosstab