【发布时间】:2018-02-22 21:52:09
【问题描述】:
我有一个大数据集(2m 行,70 个变量),其中包含许多分类变量。所有分类变量都以数字编码(例如,参见 df1)
df1:
obs gender job
1 1 1
2 1 2
3 2 2
4 1 1
我有另一个包含所有解释的数据框,如下所示:
df2:
Var: Value: Label:
gender 1 male
gender 2 female
job 1 blue collar
job 2 white collar
有没有一种快速的方法可以用 df2 中的标签替换分类列的所有值?这将节省我总是在 df2 中查找值的含义的工作。我找到了一些手动替换值的解决方案,但我正在寻找一种自动的方式来做到这一点。
谢谢
【问题讨论】:
标签: python pandas dataframe label