【发布时间】:2017-12-14 14:02:10
【问题描述】:
假设数据集中有 8 个特征。我使用 PCA 发现 99% 的信息在前 3 个特征中,使用解释方差比的累积和。 那为什么我需要使用 PCA 拟合和转换这 3 个特征才能使用它们来训练我的神经网络?为什么我不能按原样使用这三个功能?
【问题讨论】:
标签: machine-learning neural-network pca cross-validation dimension-reduction
假设数据集中有 8 个特征。我使用 PCA 发现 99% 的信息在前 3 个特征中,使用解释方差比的累积和。 那为什么我需要使用 PCA 拟合和转换这 3 个特征才能使用它们来训练我的神经网络?为什么我不能按原样使用这三个功能?
【问题讨论】:
标签: machine-learning neural-network pca cross-validation dimension-reduction
原因是,当 PCA 告诉您 99% 的方差由前三个 组件 解释时,并不意味着它由前三个 特征。 PCA 组件是特征的线性组合,但它们通常不是特征本身。例如,PCA 组件必须相互正交,而特征不必如此。
【讨论】: