【发布时间】:2020-03-21 07:51:13
【问题描述】:
我有一个数据集,我想使用 sklearn.preprocessing.OneHotEncoder 对其进行一次热编码。我的问题是编码后,结果包含的行数比原始数据集少(差为 5)。 这是我的代码:
one_hot_encoder = OneHotEncoder(handle_unknown='ignore', sparse=False)
X_cat = pd.DataFrame(
one_hot_encoder.fit_transform(X[categorical_vars]),
columns=one_hot_encoder.get_feature_names(categorical_vars)
)
提前感谢您的任何建议。 :)
【问题讨论】:
标签: python pandas machine-learning scikit-learn data-processing