【发布时间】:2020-05-21 04:55:53
【问题描述】:
我有 80 列的数据集。在 python 中,我想将数据分成前 60 个作为训练数据,第 13 个作为测试数据。如果我使用 train_test_split 函数,数据会随机拆分。我不想要火车的随机数据。
例如:数据集列如下所示:
日期 |依赖变量 |独立变量_1 |独立变量_2
train = data[:80]
test = data[13:]
从这里如何拆分因变量和自变量。(Xtrain,Xtest,Ytrain和Ytest) 提前致谢。
【问题讨论】:
-
在 60 列上训练和在 33 列上进行测试没有任何意义。训练是在与测试数据具有相同列的一小部分行上完成的
-
训练集和测试集应该具有相同的属性,那么只有当你对测试数据集进行预测时,它才会为你提供合适的结果。
-
@anon_143 不是问题。我们可以将其设为 80 和 13。
-
我所说的属性应该相同,类似于@SUN 所说的。训练和测试应该在同一列上进行,这是我们拆分的行。如果您刚刚开始使用 ML,请在 youtube 上查看 Sentdex 的 ML 视频
标签: python scikit-learn linear-regression train-test-split