【发布时间】:2017-08-15 23:08:55
【问题描述】:
我对 numpy 很陌生。我需要获取一个数据集并从中创建一个测试集和一个训练集。 如果我的数据集是一个 150 行和 4 列的 numpy 数组(最后一列是标签),那么使用数据集中的值填充训练和测试数组的 正确 方法是什么,假设数据集可以不同 - 即,我不想为测试集和训练集手动编写形状?
我想要做的是,提供一个拆分值,它将获取一个数据集并用数据集的行填充测试和训练集,根据该值拆分。
我需要这样写一个方法:
def split(dataset, value, training, test):
training = np.array #this is what I am confused about how to define
test = np.array
if random.random() < value:
#this is where I am confused about how to populate the arrays
append rows to training
else:
append rows to test
【问题讨论】:
-
“分值”是什么意思?