【发布时间】:2023-03-21 14:39:01
【问题描述】:
我在 MATLAB 中创建了一个包含 4 个已定义模式/类的 3 维随机数据集。我对数据应用了 K-means 算法,以查看 K-means 根据创建的 4 个模式/类对我的样本进行分类的能力。
我需要以下帮助;
- 我可以使用什么函数/代码来评估 K-means 算法正确识别样本类别的能力?假设我如下图所示设置 K=4:
- 如何自动识别类数 (K)?假设我的数据中的类是未知的?
我的目标是评估 K-mean 的准确性以及数据的变化(通过预处理)如何影响算法识别类别的能力。带有 MATLAB 代码的示例会很有帮助!
【问题讨论】:
-
在 k 中选择 k 是出了名的困难。一个常见的“经验法则”是 sqrt(N) 可能是一个很好的起点。我不完全清楚你在问什么——你是想根据它正确识别的组成员数量对算法进行评分,给定你拥有的一些先验知识,还是只是要求它对随机数据进行分区?
-
谢谢兰达克!是的,我想根据它正确识别的组成员数对算法进行评分,因此我需要为我的样本指定类别编号,以便与 Kmeans 分配的编号进行比较。
标签: matlab cluster-analysis k-means