特征维数带来什么问题?
1、计算
2、存储
3、泛化能力,过拟合overfitting
分类错误率与特征
特征维数决定可分性
比如:3D空间完全可分,而2D和1D投影空间有重叠
但,增加特征也可能导致分类性能更差,因为有模型估计误差(wrong model)
计算复杂度
当样本数小于特征维度时,协方差可能奇异
过拟合(overfitting)
特征维数高、训练样本少导致模型参数估计不准确,比如协方差矩阵需要样本数大于特征数
——解决办法:
1、特征降维:特征提取(变换),特征选择
2、参数共享/平滑
参考资料:
中国科学院大学硕士课《模式识别》ppt