【发布时间】:2020-03-27 13:36:54
【问题描述】:
我有 pandas DataFrame df。我想使用不同的编码器对df 的连续和分类特征进行编码。我发现使用make_column_transformer 很舒服,但是下面显示的代码在LabelEncoder() 下会失败,但在OneHotEncoder(handle_unknown='ignore')) 下可以正常工作。错误信息是:
TypeError: fit_transform() 需要 2 个位置参数,但 3 个是 给定
我不清楚如何解决这个问题。
代码:
from sklearn.compose import make_column_transformer
from sklearn.preprocessing import RobustScaler, OneHotEncoder, LabelEncoder
continuous_features = ['COL1','COL2']
categorical_features = ['COL3','COL4']
column_trans = make_column_transformer(
(categorical_features,LabelEncoder()),
(continuous_features, RobustScaler()))
X_enc = column_trans.fit_transform(df)
【问题讨论】:
标签: python pandas scikit-learn