【发布时间】:2021-03-23 16:50:11
【问题描述】:
我正在做一个计算机视觉项目,我需要应用数据增强。 我有 3 个类:两个类有 500 个图像,一个类有 1000 个图像。 我将使用数据增强生成多个版本的图像,我是否应该在两个第一类上应用 3 个随机变换以获得总共 2000 个图像,并在最后一个类上应用一个变换以获得 2000 个总类? 最后,应该对整个数据集应用数据增强,然后将其分成训练和测试,或者将其分离,然后对训练数据集应用增强。 谢谢
【问题讨论】:
-
一定要进行训练测试拆分,然后扩充训练数据。永远不要对测试数据做任何事情(预处理除外)。
标签: python computer-vision yolo data-augmentation