【发布时间】:2016-05-20 06:39:04
【问题描述】:
我想比较使用sklearn 的 k-means 库计算的两个不同集群。
from sklearn.cluster import KMeans
ya = KMeans(n_clusters=3).fit_predict(Xa)
yb = KMeans(n_clusters=3).fit_predict(Xb)
在哪里
ya
array([0, 2, 1, 1, 2, 2, 0, 2, 2, 1, 0, 0, 1, 2, 0, 1, 0, 0, 0, 0, 2, 2, 2,
2, 2, 0, 2, 0, 2, 0, 2, 2, 2, 0, 0, 1, 0, 2, 2, 2, 2, 2, 2, 0, 0, 2,
2, 0, 1, 0, 2, 2, 2], dtype=int32)
和
yb
array([1, 2, 0, 0, 2, 2, 1, 2, 2, 0, 1, 1, 0, 2, 1, 0, 1, 1, 1, 1, 2, 2, 2,
2, 2, 1, 2, 1, 2, 1, 2, 2, 2, 1, 1, 0, 1, 2, 2, 2, 2, 2, 2, 1, 1, 2,
2, 1, 0, 1, 2, 2, 2], dtype=int32)
集群相同,但标签不同。为了计算我所做的差异:
sm = difflib.SequenceMatcher(None,list(ya),list(yb))
sm.ratio()
当然,由于标签,它不起作用。有没有办法比较两个集群?
【问题讨论】:
标签: python cluster-analysis k-means