KNN sklearn 中的分类标签答案

【问题标题】：Categorical Labels in KNN sklearnKNN sklearn 中的分类标签
【发布时间】：2017-10-11 21:38:28
【问题描述】：

我正在使用sklearn.neighbors.KNeighborsRegressor 开发分类器。我使用的数据格式如下：

所有特征都是数字，除了我想使用 KNN 预测的标签。

它是一个具有多个值的分类标签，例如：'w1'、'w2'、'w3'。

我的问题是：

PD：我知道 sklearn.preprocessing.LabelEncoder 对标签进行编码，但在文档中说分类值必须是可散列的和可比较的。我的标签只是任意词，无法计算它们之间的逻辑距离。

PD2：我尝试过使用分类标签，但出现错误：

“不支持的 / 的操作数类型：'str' 和 'int'”

【问题讨论】：

【解决方案1】：

好的，我发现了我的错误。

但是aberger在KNN标签中的cmets中所说的不是在距离中使用的。

我的错误是我使用类 KNeighborsRegressor 而不是类 KNeighborsClassifier，这是一个不使用标签并接受分类标签的纯 KNN .

在 KNeighborsRegressor 类中，分配的标签是根据其最近邻居的标签的平均值计算的，因此它必须是数字。

【讨论】：