【发布时间】:2012-02-24 21:48:09
【问题描述】:
我还在研究评估使用聚类(无监督学习)形成的聚类吗?
我试过谷歌搜索,但我得到的衡量标准太理论化了。如果人们可以分享他们用来评估所形成集群的机制,那就太好了。假设我有一个 Java 集群,它将包含 Java EE、Java ME、RMI、JVM 等,另一个集群说 NoSQL,它将有 Neo4j、OrientDB、CouchDB 等。这是完美的,我的集群算法给了我最多准确的集群。
但是在训练和测试之后,我可能会说 MySQL、Oracle 在 NoSQL 集群下,所以我只是做一个手动/视觉解释,然后重新训练我的算法或调整它,以便我获得更好的集群。
现在我想自动化这个手动可视化集群的过程,并拥有一个系统,可以让我获得所形成集群的准确性。我正在寻找与搜索中使用的 Precision、Recall、NDCG、Map 等类似的东西。我的集群长度不同,并且可以形成 n 个不同的集群,因此精度/召回率不是正确的。
【问题讨论】:
标签: artificial-intelligence machine-learning cluster-analysis unsupervised-learning