【发布时间】:2018-11-05 15:30:51
【问题描述】:
在进行一次热编码时,我们陷入了虚拟变量陷阱,为避免这种情况,我们删除了其中一个分类特征。
如果对多个分类特征进行 OHE 会怎样?
有什么直观的方法可以做到这一点?
【问题讨论】:
标签: python machine-learning scikit-learn classification
在进行一次热编码时,我们陷入了虚拟变量陷阱,为避免这种情况,我们删除了其中一个分类特征。
如果对多个分类特征进行 OHE 会怎样?
有什么直观的方法可以做到这一点?
【问题讨论】:
标签: python machine-learning scikit-learn classification
也许pandas.get_dummies 会有所帮助。
你可以这样做:
import pandas as pd
dummies = pd.get_dummies(X_data, columns=[col1, col2], drop_first=True)
这对你有帮助吗? 在这里找到文档:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.get_dummies.html
【讨论】: