【发布时间】:2019-04-06 09:32:53
【问题描述】:
我有 16 列的训练数据和 14 列的测试数据,训练数据的最后两个目标列在测试数据中不存在(这非常重要)。并且已经给出了测试数据并且也给出了训练数据。
我正在考虑的方法是从组合训练数据和测试数据开始,然后将数据拆分为X_Train、Y_Train、X_Test 和Y_Test。这是一个好方法还是有其他方法可以开始?
我还没有编写代码。但在我开始之前,我需要一些建议。
谢谢
【问题讨论】:
-
如果你已经给定了训练和测试集,为什么还要合并和拆分它们?
-
恐怕我没有测试目标列,如果我使用knn,我需要为测试数据指定目标列吗?
-
按原样,问题与
python无关 - 请不要向不相关的标签发送垃圾邮件(已删除)。
标签: machine-learning classification training-data