【问题标题】:how to do one hot encoding in python for multiple categorical features together without getting trapped in dummy variable如何在 python 中对多个分类特征进行一次热编码,而不会被困在虚拟变量中
【发布时间】:2018-11-05 15:30:51
【问题描述】:

在进行一次热编码时,我们陷入了虚拟变量陷阱,为避免这种情况,我们删除了其中一个分类特征。

如果对多个分类特征进行 OHE 会怎样?

有什么直观的方法可以做到这一点?

【问题讨论】:

    标签: python machine-learning scikit-learn classification


    【解决方案1】:

    也许pandas.get_dummies 会有所帮助。

    你可以这样做:

    import pandas as pd
    dummies = pd.get_dummies(X_data, columns=[col1, col2], drop_first=True)
    

    这对你有帮助吗? 在这里找到文档:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.get_dummies.html

    【讨论】:

    • 谢谢,@Mohamed AL ANI
    • 不用担心,如果这是正确的,您可以验证答案,以便与您有相同问题的人可以看到它
    猜你喜欢
    • 2018-07-16
    • 2020-11-12
    • 2022-08-04
    • 2017-01-07
    • 2018-07-17
    • 1970-01-01
    • 1970-01-01
    • 2022-09-27
    • 2017-07-12
    相关资源
    最近更新 更多