【发布时间】:2013-07-15 18:47:49
【问题描述】:
我必须在 rapidminer 中使用不同的性能算子检查各种集群算法的性能。为此,我想知道以下几点:
- 簇数索引值表示什么是簇数性能算子的输出?
- 集群距离和平均值内的平均值的小值和大值有何作用。质心距离内的聚类好坏均值?
- 我还想检查其他索引值,例如 Dunn 索引、Jaccard 索引、Fowlkes–Mallows 等各种聚类算法。但是 rapidminer 没有任何操作员,为此该怎么办。我没有使用 R 的经验。
【问题讨论】:
-
您是否将Rstats 与 Rapidminer 中的某些内容混淆了? “R”标签用于 Rstats..
-
考虑使用 ELKI。如果您有标记数据,它将为您提供广泛的集群质量指数。
标签: cluster-analysis k-means rapidminer