【问题标题】:Choosing number of clusters in k means选择 k 中的簇数意味着
【发布时间】:2023-03-12 20:16:01
【问题描述】:

我想对大量数据样本进行聚类,为此我在 MATLAB 中使用 k 均值函数。问题是它返回一个矩阵,其中所有数据都按我指定的集群数量排序。

我如何知道哪些集群数量是最佳的。

我认为如果我能在每个集群中获得相同数量的元素,那将是最佳的,但这种情况永远不会发生。相反,它可以继续对我输入的任何数字的数据进行聚类。

请帮忙...

【问题讨论】:

标签: algorithm matlab


【解决方案1】:

我读过,我认为这个问题的答案可能是:- 在 kmeans 中,我们试图根据数据来的方式对数据进行分区,因此理论上我们最好的数据集是每个分区具有相同数量的数据。

我使用了 kmeans++,它是一种比 kmeans 更好的算法,因为它不会初始化随机值,然后迭代分区的数量,直到分区的大小几乎相等。这是一个近似数字,例如 3 我得到 2180,729,1219,而 4 我得到 30,2422, 1556,120 所以我选择 3 作为我的最终答案............

【讨论】:

    猜你喜欢
    • 2015-02-19
    • 2018-01-22
    • 2019-04-23
    • 1970-01-01
    • 2013-05-17
    • 2018-10-12
    • 2017-10-01
    • 2020-09-06
    • 1970-01-01
    相关资源
    最近更新 更多