【发布时间】:2017-04-10 01:42:54
【问题描述】:
我有一个名为“admissions”的数据集。
我正在尝试对一个简单的数据集进行保留验证。为了对数据集的索引进行排列,我使用以下命令:
import numpy as np
np.random.permutation(admissions.index)
我需要在排列之前使用np.random.seed() 吗?如果是这样,那么np.random.seed(number)中的数字为什么以及代表什么?
【问题讨论】:
-
如果您希望能够以完全相同的排列重复实验(例如出于调试目的),您需要设置可重现的种子。如果您不需要能够重复,那么您可以跳过显式播种部分。如果您确实为调试设置了显式种子,请在完成调试后将其删除。