【问题标题】:How to use principal component analysis (PCA) to speed up detection?如何使用主成分分析(PCA)来加速检测?
【发布时间】:2017-03-11 10:50:35
【问题描述】:

我不确定我是否正确应用了 PCA!我有 p 个特征和 n 个观察值(实例)。我把这些放在一个 nxp 矩阵 X 中。我执行平均归一化,得到归一化矩阵 B。我计算 pxp 协方差矩阵 C=(1/(n-1))B*.B 的特征值和特征向量,其中 * 表示共轭转置。

降序特征值对应的特征向量在一个pxp矩阵E中。假设我想将属性数量从p减少到k。我使用方程式 X_new=B.E_reduced,其中 E_reduced 是通过选择 E 的前 k 列产生的。这是我的问题:

1) 应该是 X_new=B.E_reduced 还是 X_new=X.E_reduced?

2) 我应该在测试阶段重复上述计算吗?如果测试阶段与训练阶段类似,则无法获得加速,因为我必须在测试阶段计算每个实例的所有 p 个特征,而 PCA 由于特征向量计算开销而使算法变慢。

3) 应用 PCA 后,我注意到准确率有所下降。这是否与数字 k(我设置 k=p/2)或我使用线性 PCA 而不是内核 PCA 的事实有关?选择数字 k 的最佳方法是什么?我读到我可以找到k个特征值之和与所有特征值之和的比率,并根据这个比率做出决定。

【问题讨论】:

    标签: machine-learning data-mining pca feature-extraction dimensionality-reduction


    【解决方案1】:

    您通常将乘法应用于居中的数据,因此您的投影数据也居中。

    在测试期间切勿重新运行 PCA。仅在训练数据上使用,并保留移位向量和投影矩阵。您需要完全应用与训练期间相同的投影,而不是重新计算新的投影。

    性能下降可能有很多原因。例如。您是否还使用特征值的根应用缩放?而你最开始用的是什么方法?

    【讨论】:

    • 投影矩阵是矩阵B,对吗?什么是位移向量?所以,我得到一个 1xp 向量 y 用于测试实例。如何投影向量 y?我没有使用特征值的根缩放,你能详细说明一下吗?所谓方法,是指分类方法吗?
    • 通常,人们会以不同的方式构造投影矩阵,并结合缩放因子。移位偏移量是用于居中的向量,因此您有 B(x-mu) 作为投影操作。
    猜你喜欢
    • 1970-01-01
    • 2013-04-07
    • 2015-07-29
    • 2021-12-02
    • 2013-03-31
    • 2012-10-24
    • 2013-03-28
    • 2012-12-05
    • 2013-03-28
    相关资源
    最近更新 更多