【发布时间】:2019-09-30 21:10:56
【问题描述】:
我是 Python 新手。我有一个如下的数据框:
d = {'Categorical': ['A','B','C','A'],
'Order': ['First','Second', 'First','Second'],
'Numerical': [20,22,21,25]}
df = pd.DataFrame(data=d)
我应该处理这个框架以获得以下内容:
Categorical Order Numerical
1 1 20
2 2 22
3 1 21
1 2 25
这里的窍门如下:
Python 应该理解 Categorical 列是分类的。而Order 列在顺序很重要的地方是枚举的。
考虑到这里的 dtype,我应该做什么编码?
【问题讨论】:
-
pd.factorize(df.Categorical) -
您能否提供更多关于列
Order的信息。只是['First', 'Second']还是您在某个地方有特定的命令? -
你可以认为它只是
['First', 'Second']。我有多少独特的价值观并不重要。原始数据类型是str,我知道这些字符串的顺序。
标签: python pandas type-conversion enumeration categorical-data