【发布时间】:2015-07-22 01:29:37
【问题描述】:
我目前正在尝试解释从 Diabetes.arff 数据集上运行 SimpleKMeans 聚类收集的一组结果。
http://i.stack.imgur.com/T4eho.jpg - 链接到集群实例(图 1)
到目前为止,我可以理解集群实例(图 1)显示 500 个变量已被归类为测试阴性,268 个变量已被归类为测试阳性。
http://i.stack.imgur.com/X9szt.jpg - 链接到真实值(图 2)
当将这些值与 groundtruth 值进行比较时,没有太大差异,因为正确的聚类应该表明 500 个被归类为测试阴性,268 个被归类为测试阳性。这在技术上意味着 SimpleKMeans 聚类方法适合此数据集,因为它已正确分类实例。
但我不知道如何解释集群质心表中的信息,在完整数据、集群 #0 和集群 1 标题下。他们告诉我们关于数据集的什么信息(图 1)?
【问题讨论】:
标签: machine-learning cluster-analysis weka