【发布时间】:2019-02-24 23:49:05
【问题描述】:
我在运行下面的代码时遇到问题。
data 是我的数据框。 X 是训练数据的列列表。 L 是具有数值的分类特征列表。
我想对我的分类特征进行一次热编码。所以我做如下。但是会抛出“ValueError: Columns must be same length as key”(对于最后一行)。经过长时间的研究,我仍然不明白为什么。
def turn_dummy(df, prop):
dummies = pd.get_dummies(df[prop], prefix=prop, sparse=True)
df.drop(prop, axis=1, inplace=True)
return pd.concat([df, dummies], axis=1)
L = ['A', 'B', 'C']
for col in L:
data_final[X] = turn_dummy(data_final[X], col)
【问题讨论】:
-
在这种情况下
X是什么?
标签: python pandas dummy-variable one-hot-encoding