【发布时间】:2017-04-09 06:33:47
【问题描述】:
据我了解,我认为 PCA 只能针对连续特征执行。但是,在尝试了解 onehot 编码和标签编码之间的区别时,通过以下链接中的帖子:
When to use One Hot Encoding vs LabelEncoder vs DictVectorizor?
它指出,一个热编码后跟 PCA 是一种非常好的方法,这基本上意味着 PCA 应用于分类特征。 因此感到困惑,请同样建议我。
【问题讨论】:
-
我想问一下以下文章是否通过对它们的 ASCII 字节表示求和来将分类变量转换为数字是一个好主意? blog.davidvassallo.me/2015/10/28/…
标签: python machine-learning scikit-learn data-mining