【发布时间】:2011-08-18 22:56:42
【问题描述】:
excel 中有一个数据集,其中包含 A 列中的一些标签(我称之为集群标签)和 B 列中的一些属性(我称之为集群组件)。这些数据显示了最好的聚类结果。
但我不知道如何在 rapidminer 中使用这些数据计算其他聚类方法的召回率和精度!
谁能帮帮我?
【问题讨论】:
标签: cluster-analysis rapidminer precision-recall
excel 中有一个数据集,其中包含 A 列中的一些标签(我称之为集群标签)和 B 列中的一些属性(我称之为集群组件)。这些数据显示了最好的聚类结果。
但我不知道如何在 rapidminer 中使用这些数据计算其他聚类方法的召回率和精度!
谁能帮帮我?
【问题讨论】:
标签: cluster-analysis rapidminer precision-recall
下面的link 给出了一个使用RapidMiner 算子“Map Clustering on Labels”的例子。这会将已知的集群标签映射到由聚类算法分配的集群。由此,输出可用于创建混淆矩阵,可以确定准确率和召回率。
希望对你有帮助...
【讨论】:
请注意,当您拥有更多类别/标签时,精度和召回率必须针对各个类别。
【讨论】: