【发布时间】:2021-06-18 09:49:42
【问题描述】:
假设我有一个数据集并且它有一个类列:[1,1,0,0,2,2]。然后我使用 kmeans 聚类作为分类,并假设我得到的聚类标签为:[0,0,1,1,2,2]。
现在,如果我使用 confusion_matrix 或 classification_report 来评估算法(将集群标签作为类处理),我应该得分完美,但实际上我不会因为类 0 和类之间的集群标签不匹配1.
这是假设性问题,我没有代码。我该如何处理?我正在使用 scikit-learn。
【问题讨论】:
-
你听起来很困惑; kmeans 是一种无监督算法,
confusion_matrix和classification_report都不适用。正如您的标题所声称的,这也不是一个分类问题。 -
我说,这是一个假设的、虚构的问题。我知道当我已经有分类列时,我不应该使用无监督算法。我只是在玩,但我认为我的问题是有效的。
-
有效。但无论是否假设,尝试准确使用所使用的术语并没有什么坏处(编辑过的标题和帖子,请确保它仍然准确地描述了您的情况)。
标签: python scikit-learn k-means