【发布时间】:2016-07-01 22:16:35
【问题描述】:
我正在尝试识别一段时间内的热门 IP。
我对某些特征进行了聚类,得到了 12 个聚类输出,其中 8 个是机器人,4 个是人类,根据聚类的质心值。
现在我可以使用什么技术来分析集群内的数据,以便知道集群内的数据点在正确的集群中。
换句话说,是否有任何统计方法可以检查集群的质量?
我能想到的是,如果我取一个位于集群边界的数据点,如果我测量这个点与其他质心和它自己的质心的距离,那么我能知道如何关闭这两个集群对我来说很重要,可能我的数据在集群中划分得有多好??
请指导如何衡量我的集群的质量,关于数据点以及这样做的标准技术是什么。
提前致谢。!! 干杯。!
【问题讨论】:
标签: machine-learning cluster-computing cluster-analysis k-means