【发布时间】:2015-06-11 23:14:23
【问题描述】:
我有一个 500x1000 的特征向量,主成分分析表明超过 99% 的总方差被第一个成分覆盖。所以我用 1 维点替换 1000 维点,给出 500x1 特征向量(使用 Matlab 的 pca 函数)。但是,我的分类器准确度最初是 80% 左右,有 1000 个特征,现在下降到 30%,只有 1 个特征,即使超过 99% 的方差是由这个特征引起的。对此有何解释或我的方法有误?
(这个问题部分源于我之前的问题Significance of 99% of variance covered by the first component in PCA)
编辑: 我使用weka的主成分法进行降维和支持向量机(SVM)分类器。
【问题讨论】:
-
你能给出一些代码吗?还是更好地提供您的数据?我还注意到,有时在 pca 识别率下降但从 80% 下降到 30% 后,这是相当惊人的
-
你能说明如何从原始数据中得到 500x1 的数据吗?
-
很抱歉,我目前无法共享数据集
-
尝试同样的方法,但使用 5 或 6 个主成分,
标签: matlab machine-learning pca