【发布时间】:2014-10-11 19:36:52
【问题描述】:
我正在尝试使用随机森林为具有 5 个预测变量的数据集构建分类模型。两个预测变量是连续类型的,一个可以是[0, 1000]区间内的实数值,另一个可以是[-10, 10]区间内的实数值;一个预测变量是整数值[10000, 15000]。此外,剩下的两个预测变量是分类值,即{ A, B, C, D, E F} 和{NY, LA, Chicago}。预处理这些不同的预测器类型是否需要任何程序?
【问题讨论】:
标签: machine-learning classification random-forest feature-selection