【发布时间】:2020-11-09 19:27:34
【问题描述】:
我正在准备用于训练图像识别模型的数据。我目前有一个文件夹(数据集),其中包含多个带有标签名称的文件夹,这些文件夹中包含图像。
我想以某种方式拆分此数据集,以便我有两个具有相同子文件夹的主文件夹,但这些文件夹中的图像数量要根据首选的训练/测试拆分,例如 90% 的图像训练数据集和测试数据集中的 10%。
我正在努力寻找拆分数据的最佳方法。我已经阅读了一个建议,即 pytorch torch.utils.Dataset 类可能是一种方法,但我似乎无法让它发挥作用来保留文件夹层次结构。
【问题讨论】:
标签: python machine-learning pytorch