【发布时间】:2017-11-18 18:07:01
【问题描述】:
我有一个这样的数组:
sampleA 1 2 2 1
sampleB 1 3 2 1
sampleC 2 3 1 2
我的目标是跨样本运行 PCA 并查看它们的聚类。但是,我需要在行标题中保留样本名称。有什么办法可以做到这一点?所需的 PCA 结果包括行标题:
sampleA 0.13 0.1
sampleB 0.1 0.4
sampleC 0.1 0.1
目前只运行这两条简单的线路:
my_pca = PCA(n_components=8)
trans = my_pca.fit_transform(in_array)
【问题讨论】:
-
只是想知道如何使代码工作?你的数组的形状是
(3, 4)。如果您将其与n_components=8匹配,您应该会收到一条错误消息。如果我将它与n_components=2匹配,我没有得到结果,sampleA 0.13 0.1,你已经提到了。我在这里错过了什么吗? -
对不起,我的实际数据是一个更大的数组,绝对不能轻易放入评论框:)
-
没问题。只是我无法用你的代码重现你的结果,我害怕错过一些东西而变得愚蠢。
标签: python scikit-learn pca