【发布时间】:2016-05-15 18:25:55
【问题描述】:
我使用逻辑回归。我们知道它是一种监督方法,需要在训练和测试数据中计算特征值。有六个特点。尽管函数产生的这些特征的值不同并且它们的最大值可以是 1,但有四个特征(在训练数据和测试数据中)的值非常低。例如它们的范围在 0 到 0.1 之间,从不为 1,甚至超过 0.1 !!!因此,这些特征的值非常接近。其他特征呈正态分布(它们的范围在 0 到 0.9 之间)。所以这两种特征之间的差异很大,我认为这会给逻辑回归的学习过程带来麻烦。我对吗?!它是否需要对这些功能进行任何转换/规范化?任何帮助将不胜感激。
【问题讨论】:
标签: machine-learning classification normalization transformation logistic-regression