使用 k-means 聚类理解主成分分析答案

【问题标题】：Understanding principal component analysis with k-means clustering使用 k-means 聚类理解主成分分析
【发布时间】：2021-12-20 14:48:50
【问题描述】：

我有一个可视化，绘制 k 表示具有主成分分析 (PCA) 值的集群。据我了解。 PCA 是一种算法，可以将大量数据缩减为更小的数据，以便我们更好地进行可视化。

我可以将我的可视化解释为大多数数据彼此相似，这就是它们彼此聚集的原因吗？

或者我对带有 K 表示聚类的 PCA 的理解是错误的？

【问题讨论】：

【解决方案1】：

PCA 将初始特征空间投影到低维空间。不过要小心，在应用 PCA 之后，特征不是初始特征，而是特征向量。这就是为什么 PCA 属于特征转换的范畴。

关于您的问题，似乎采用前两个特征向量（也就是具有最大特征值的特征向量）没有帮助。但是，我建议在得出“我的数据无法聚类”的结论之前尝试以下操作：

我看到了 3 个集群，请注意如何确定集群的数量。

【讨论】：