【发布时间】:2017-10-24 21:54:20
【问题描述】:
我希望使用 Python 对一些具有大量分类变量的数据进行多元线性回归或逻辑回归。我知道,对于一个分类变量,我需要将其转换为一个虚拟变量,然后删除一种虚拟变量以避免共线性,但是有没有人熟悉在处理一种以上类型的分类变量时应该采用什么方法?
我对每个都做同样的事情吗?例如将每种类型的记录转换为一个虚拟变量,然后为每个类型删除一个虚拟变量以避免共线性?
【问题讨论】:
标签: python machine-learning dummy-variable