【发布时间】:2019-02-18 00:48:36
【问题描述】:
我有一个顺序数据(每次一个实例)要聚集成两个类。我想为此任务使用 K-means 的顺序版本(sequential K-means)。
在开始时为算法随机指定两个集群的中心时,我希望它们之间的距离尽可能大(即彼此相距很远),这样得到的两个集群的分布不会受到初始中心的影响。
我的想法对吗?如果是这样,我该怎么做?
【问题讨论】:
-
也许您可以提供有关您的数据以及您想要实现的目标的更多详细信息,因为我认为我并不完全理解。 K-Means 将尝试将您的数据分成大小相等的集群,并假设平均值将收敛到集群的中心。也许另一种算法会更合适?
-
我对问题做了一些修改,希望现在清楚