【发布时间】:2018-04-22 18:32:29
【问题描述】:
我正在尝试根据特定给定数据集对客户进行分组,该数据集具有 DOB、性别、状态、pincode、transaction_id、promocode 等属性。
每次我运行算法时,聚类的轮廓分数与前一次的差异很大,即结果不一致。 这可能是因为数据集的随机种子。这是将属性传递给算法的行。
km1 = KMeans(n_clusters=6, n_init=25, max_iter = 600)
是否有任何方法可以分配集群或优化,以便每次运行程序后,分数都一致且更好?
我正在使用带有 scikit-learn 的 Python 3。
【问题讨论】:
-
我们在这里讨论的是什么语言和框架?是带有 scikit-learn 的 Python 吗?请澄清(特定标记也可以完成这项工作)...
标签: python machine-learning scikit-learn cluster-analysis k-means