【发布时间】:2017-01-08 21:01:59
【问题描述】:
我正在尝试对一组数据进行聚类分析,但无法找到正确的见解。示例:我在 100 个资源(列)中有一组 50 个变量(行)。每种资源都有一些变量,如强项和弱点。我将强度标记为 1,将弱点标记为 2。因为,每个资源可能只有 10 个变量作为强度,5 个变量作为弱点,因此其他遗漏的变量被标记为零。现在,我想找到具有共同优势和劣势的资源集群。
我通过转置数据集来使用层次聚类和 k-means,以便资源在行中。 k-means 图显示不同聚类之间有太多重叠,因此仅使用层次聚类。我已将 1(强度)替换为 +10,将 2(弱)替换为 -10,以查看集群算法的响应是否不同,但仍然没有太大帮助。
有任何意见可以改进此方法和处理此问题的替代方法吗?
非常感谢!
【问题讨论】:
标签: r cluster-analysis k-means hierarchical-clustering