【发布时间】:2022-01-23 07:32:22
【问题描述】:
如何编码具有更多类别的变量?例如,数据集包含student_id|languages|score。如果我们考虑 101,那么我们将有 3 行的标志设置为 3 行。我们应该为三个变量中的每一个设置一个标志为 1 的行,还是应该在每个变量中设置三个 2?
101|English|98
101|French |60
101|Spanish|79
102|English|100
103|Spanish|60
【问题讨论】:
-
我投票结束这个问题,因为它不是关于编程,而是关于 ML 理论和/或方法 - 请参阅 stackoverflow.com/tags/machine-learning/info 中的介绍和注释
标签: python machine-learning scikit-learn