【发布时间】:2020-05-24 23:09:59
【问题描述】:
对于某些数据,我们可能需要手动创建特征,这些特征是早期特征的组合,以获得更好的算法。下面的分布(以及任何其他分布是椭圆且其轴未与特征轴对齐的分布)是高斯分布不起作用的简单示例。
在那门课程中被告知多元高斯分布最适合它,或者我们可以开发一个新特征 x_3 = x_2 - x_1 和 x_4 = x_2 + x_1,并使用这两个新特征作为椭圆的轴,因为有了这些轴,椭圆将不再是倾斜,并且正态高斯分布可以工作。
我想自动执行此新特征选择,并认为使用 PCA(具有高方差 %)将有助于创建“线性类型”的新特征,例如 x_2 - x_1。这个image(来自与上述相同的课程)的长对角黑线正是我们所需要的,这条黑线是使用 PCA 生成的。
上述方法可行吗?有没有比我们能做的更好的方法来自动生成新特征(线性类型和其他类型)?我也想到了神经网络和内核,但我有一种预感,它们在计算方面会非常昂贵。
【问题讨论】:
标签: machine-learning pca gaussian anomaly-detection