【问题标题】:How to split data into train and test sets using torchvision.datasets.Imagefolder?如何使用 torchvision.datasets.Imagefolder 将数据拆分为训练集和测试集?
【发布时间】:2019-12-06 08:50:21
【问题描述】:

在我的自定义数据集中,一种图像在一个文件夹中,torchvision.datasets.Imagefolder 可以处理,但是如何将数据集拆分为训练和测试?

【问题讨论】:

    标签: machine-learning image-processing computer-vision pytorch


    【解决方案1】:

    您可以使用 torch.utils.data.Subset 将您的 ImageFolder 数据集拆分为基于示例索引的训练和测试。
    例如:

    orig_set = torchvision.datasets.Imagefolder(...)  # your dataset
    n = len(orig_set)  # total number of examples
    n_test = int(0.1 * n)  # take ~10% for test
    test_set = torch.utils.data.Subset(orig_set, range(n_test))  # take first 10%
    train_set = torch.utils.data.Subset(orig_set, range(n_test, n))  # take the rest   
    

    【讨论】:

    • 这样可以保持标签之间的速率吗?
    • @toy_programmer 您可能需要更加小心 I. 为训练/测试选择索引的方式
    • 同意@Shai。如果数据是有序的,您将只参加前 10% 的课程
    猜你喜欢
    • 1970-01-01
    • 2019-05-01
    • 2021-02-27
    • 1970-01-01
    • 2019-08-01
    • 1970-01-01
    • 2017-11-01
    • 2019-06-30
    • 1970-01-01
    相关资源
    最近更新 更多