【发布时间】:2018-02-08 14:02:37
【问题描述】:
我知道 vw 可以处理非常原始的数据(例如原始文本),但例如,是否应该在将数据提供给 vw 之前考虑缩放数字特征? 考虑以下行:
1 |n age: 80.0 height: 180.0 |c male london |d the:1 cat:2 went:3 out:4
假设典型的年龄范围从 1 到 100,身高(以厘米为单位)可能从 140 到 220,转换/缩放 age 和 height 是否更好,以便它们共享一个共同的范围?我认为许多算法可能需要对其输入数据进行这种预处理,例如线性回归。
【问题讨论】:
标签: r machine-learning data-processing vowpalwabbit