【问题标题】:PCA Analysis and Plotting with Python [duplicate]使用 Python 进行 PCA 分析和绘图
【发布时间】:2012-11-20 02:21:28
【问题描述】:

可能重复:
PCA Analysis with Python

我有这个data,它的尺寸是 1940 x 4。它的行是读数或样本,而它的列是变量(温度、湿度、风速和压力)。我想进行 PCA 分析并使用 Python 绘制其结果。情况是,我最终得到了一些技术和示例,但我不确定如何利用它们以及即使我得到 PCA 结果该做什么。所以,我在这里寻找一个代码示例,通过它我可以在这种数据集上用 Python 实现 PCA 分析,以及了解如何解释 PCA 结果以及如何绘制它们。最后,如何解释图。非常感谢。

【问题讨论】:

  • E 先生的评论应该会有所帮助。此外,您的previous question 似乎得到了一些非常可靠的答案(我不确定这个问题有什么不同。)
  • 我看过这个例子..它说这就是你如何绘制你的 PCA..我需要知道我应该如何绘制以及在 PCA 结果中绘制什么以及如何正确解释它们..:(
  • 你想要PCA做什么,因为你的数据只有4维,你还想减少维度吗?
  • 确保在某些纯文本编辑器中打开数据文件,在 excel 中的 b/c 看起来很吓人。

标签: python numpy matplotlib scipy pca


【解决方案1】:

主成分分析对于降低数据集的维度很有用。由于您的数据仅包含四个变量并且(据我所知)它们不相关,因此我不希望 PCA 对任何实际分析有价值。

如果我错了,并且您真诚地期望某些变量是相关的,您可以使用 PCA 来识别捕获大部分典型协方差的最重要的 4 向量。这些是协方差矩阵的特征向量。需要四个这样的向量才能完全跨越与输入变量相同的空间。

在测量大量变量且存在大量相互信息的系统中,PCA 可识别独立信息的重要位。我认为您的系统不是这种情况。

【讨论】:

    猜你喜欢
    • 2013-04-07
    • 2013-03-28
    • 2019-08-22
    • 2017-12-24
    • 1970-01-01
    • 2016-01-12
    • 2015-07-03
    • 2015-11-18
    • 2019-02-08
    相关资源
    最近更新 更多