【问题标题】:Clustering accuracy check with Confusion Matrix使用混淆矩阵进行聚类准确性检查
【发布时间】:2021-06-14 11:12:12
【问题描述】:

我有一个事故位置数据集。我使用纬度和经度列在此数据集上应用了几种聚类算法。现在我想分别测量不同聚类算法的准确率来比较它们。

我想应用article 中描述的混淆矩阵。

但我无法理解我应该将什么视为标签?我只使用纬度和经度两列来制作我的集群。有人可以指导我吗?我有代码,但我不清楚。我的意思是我的情况下的标签或类别标签是什么?

【问题讨论】:

  • 我投票结束这个问题,因为它与 help center 中定义的编程无关,而是关于 ML 理论和/或方法 - 请参阅 machine-learning @ 中的介绍和注意事项987654323@.

标签: machine-learning cluster-analysis confusion-matrix


【解决方案1】:

在混淆矩阵中,您为每个条目提供两组标签。这些标签之一是您所做的聚类生成的聚类分配。第二个标签可以是基本事实,可让您确定准确度/精确度。

您的案例听起来没有基本事实,因此您无法比较准确性。您可以使用您用作第二组标签的不同算法之一的结果来比较这两个聚类之间的结果。

【讨论】:

  • 但在我的例子中,一种算法给出了 10 个集群,而另一种算法给出了 13 个集群。据我所知,混淆矩阵是一个 n*n 矩阵。
  • 不,混淆矩阵不一定是方阵,只是方阵时更容易解释。
猜你喜欢
  • 2013-09-17
  • 2018-04-16
  • 2018-05-22
  • 2022-01-19
  • 2013-12-02
  • 2016-08-25
  • 1970-01-01
  • 1970-01-01
  • 2014-01-22
相关资源
最近更新 更多