【问题标题】:How to compute accuracy for cluster evaluation in Weka如何在 Weka 中计算集群评估的准确性
【发布时间】:2015-05-20 03:29:24
【问题描述】:

我们如何使用 Weka 计算集群的准确度?

我可以使用这个公式:

Accuracy (A) = (tp+tn)/Total # samples

但是如何知道Weka工具中实验输出的真阳性、假阳性、真阴性和假阴性是什么?

【问题讨论】:

  • 准确率不是聚类的常用评估指标。什么是“真阳性”,什么是“真阴性”?

标签: machine-learning weka data-mining evaluation unsupervised-learning


【解决方案1】:

Weka 中有几种不同的聚类模式:

使用训练集(默认): 聚类后,Weka 将训练实例分类到它开发的集群中,并计算每个集群中实例的百分比。例如,集群 0 中的 X% 和集群 1 中的 Y% 等。

提供的测试集:如果集群表示像 EM 算法一样具有概率,则 Weka 可以在单独的测试数据上评估集群。

使用类进行聚类评估: 在这种模式下,Weka 首先忽略类属性并生成聚类。在测试期间,它根据每个集群内类属性的多数值为集群分配类标签。最后计算分类误差,并显示对应的混淆矩阵。

【讨论】:

  • 但是我如何计算聚类的准确性
  • 为此,您需要知道分配给每个数据点的实际集群。在这种情况下,您可以使用与分类非常相似的第三种方法。
【解决方案2】:

看看cross-validation 原则。在您的 java 代码中使用 ClusterEvaluation 的方法 crossValidateModel 和 evaluateClusterer。或者您也可以直接使用 weka GUI 进行实验。

【讨论】:

    【解决方案3】:

    基于this 对类似问题的回答,可以通过包管理器下载的classificationViaClusteringmeta 分类器可以满足您的需求。

    【讨论】:

      猜你喜欢
      • 2019-05-01
      • 1970-01-01
      • 2012-06-08
      • 2022-01-19
      • 2020-01-13
      • 2020-05-05
      • 2015-06-18
      • 2022-08-07
      • 1970-01-01
      相关资源
      最近更新 更多