【发布时间】:2019-06-13 08:05:13
【问题描述】:
X_train, X_test, y_train, y_test = train_test_split (X, y, test_size=0.20, random_state=0)
在上面的代码中,random_state 使用了 0。为什么我们不使用 1?
【问题讨论】:
-
随机状态的值不会显着影响预测(差异可以忽略不计)。它只是为了在将来或在不同的系统/环境上再次重现结果而提供。它只是一颗种子。因此,如果您使用 random_state=50,那么 7 天后使用相同的 random_state=50 值,您将获得完全相同的拆分输出(即使在不同的环境/系统上)。
标签: python machine-learning data-science