【发布时间】:2018-08-09 19:22:32
【问题描述】:
我需要将数据集拆分为训练和测试。 我需要最后 20% 的值用于测试,前 80% 用于训练。 我目前使用了“train_test_split()”,但它随机选择数据而不是最后 20%。我怎样才能得到最后 20% 的测试和前 80% 的训练? 我的代码如下:
numpy_array = df.as_matrix()
X = numpy_array[:, 1:26]
y = numpy_array[:, 0]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=20) #I do not want the data to be random.
谢谢
【问题讨论】:
标签: python arrays numpy scikit-learn