【发布时间】:2019-06-20 22:58:20
【问题描述】:
我可以将分类列转换为它们的分类代码,但我如何准确地了解它们的映射?示例:
df_labels = pd.DataFrame({'col1':[1,2,3,4,5], 'col2':list('abcab')})
df_labels['col2'] = df_labels['col2'].astype('category')
df_labels 看起来像这样:
col1 col2
0 1 a
1 2 b
2 3 c
3 4 a
4 5 b
如何将猫代码准确映射到猫类别? 下面的 stackoverflow 响应说要枚举类别。但是,我不确定枚举是否是 cat.codes 生成整数值的方式。有没有更准确的方法?
Get mapping of categorical variables in pandas
>>> dict( enumerate(df.five.cat.categories) )
{0: 'bad', 1: 'good'}
获得上述格式但准确的映射的好方法是什么?
【问题讨论】:
-
仅供参考,我已经更新了我的答案(您链接到的)并添加了一些解释/验证。我相信它是准确的,但如果您能详细说明您认为不准确的地方,我很乐意对其进行改进。