【发布时间】:2018-04-09 20:35:25
【问题描述】:
我有如下训练数据
col1 col2 col3 col4 col5 Target
187.67 448.41 45.7 880070.41 1 -3
95.44 446.08 70.51 909069.06 4 120
我需要建立一个模型并使用以下数据进行测试,
col1 col2 col3
45 2989 12
3 1111 121
测试数据只有三列。我打算用所有 5 列作为训练数据集的特征列来构建一个模型。只用三列训练数据集构建模型并且只使用 3 列测试数据进行预测是否很好?还是用 5 列火车数据集构建模型好 并对测试的 col4 和 col5 进行预处理(估算)然后运行预测?我们觉得 col4 和 col5 很重要。请建议处理此问题的方法?
【问题讨论】:
标签: python r machine-learning data-mining non-linear-regression