【发布时间】:2021-12-20 14:48:50
【问题描述】:
我有一个可视化,绘制 k 表示具有主成分分析 (PCA) 值的集群。 据我了解。 PCA 是一种算法,可以将大量数据缩减为更小的数据,以便我们更好地进行可视化。
我可以将我的可视化解释为大多数数据彼此相似,这就是它们彼此聚集的原因吗?
【问题讨论】:
-
这似乎不是与 python 相关的问题。
我有一个可视化,绘制 k 表示具有主成分分析 (PCA) 值的集群。 据我了解。 PCA 是一种算法,可以将大量数据缩减为更小的数据,以便我们更好地进行可视化。
我可以将我的可视化解释为大多数数据彼此相似,这就是它们彼此聚集的原因吗?
【问题讨论】:
PCA 将初始特征空间投影到低维空间。不过要小心,在应用 PCA 之后,特征不是初始特征,而是特征向量。这就是为什么 PCA 属于特征转换的范畴。
关于您的问题,似乎采用前两个特征向量(也就是具有最大特征值的特征向量)没有帮助。但是,我建议在得出“我的数据无法聚类”的结论之前尝试以下操作:
我看到了 3 个集群,请注意如何确定集群的数量。
【讨论】: