【发布时间】:2019-12-06 08:50:21
【问题描述】:
在我的自定义数据集中,一种图像在一个文件夹中,torchvision.datasets.Imagefolder 可以处理,但是如何将数据集拆分为训练和测试?
【问题讨论】:
标签: machine-learning image-processing computer-vision pytorch
在我的自定义数据集中,一种图像在一个文件夹中,torchvision.datasets.Imagefolder 可以处理,但是如何将数据集拆分为训练和测试?
【问题讨论】:
标签: machine-learning image-processing computer-vision pytorch
您可以使用 torch.utils.data.Subset 将您的 ImageFolder 数据集拆分为基于示例索引的训练和测试。
例如:
orig_set = torchvision.datasets.Imagefolder(...) # your dataset
n = len(orig_set) # total number of examples
n_test = int(0.1 * n) # take ~10% for test
test_set = torch.utils.data.Subset(orig_set, range(n_test)) # take first 10%
train_set = torch.utils.data.Subset(orig_set, range(n_test, n)) # take the rest
【讨论】: