【发布时间】:2020-10-27 09:28:23
【问题描述】:
我正在使用 Matlab 分类学习器应用程序在训练集(大小 = 700)上测试不同的分类器。我的响应变量是具有 5 个可能值的分类标签。我有 7 个数字特征和 2 个分类特征。我发现 Cubic SVM 的准确率最高,为 83%。但是当我启用具有 95% 解释方差(准确度 = 40.5%)的 PCA 时,性能会大幅下降。我是一名学生,这是我第一次使用 PCA。
- 为什么我会看到这样的结果?
- 可能是因为数据集小/不平衡?
- 什么时候应用 PCA 有用?当我们说“降维”时,原始集合中是否存在最小数量的特征(维数)?
感谢任何帮助。提前致谢!
【问题讨论】:
-
PCA 假设高斯分布输入,我根本不适用于分类数据
-
PCA 线性组合所有输入。这是到不同空间的映射(相同维度,除非您删除某些维度)。您可能会丢失或掩盖某些非线性相关性
标签: matlab computer-vision classification pca