【发布时间】:2021-05-08 04:49:50
【问题描述】:
我是 tensorflow/keras 的新手,我有一个包含 3000 个文件夹的文件结构,每个文件夹包含 200 个图像,每个图像都作为数据加载。我知道keras.preprocessing.image_dataset_from_directory 允许我加载数据并将其拆分为训练/验证集,如下所示:
val_data = tf.keras.preprocessing.image_dataset_from_directory('etlcdb/ETL9G_IMG/',
image_size = (128, 127),
validation_split = 0.3,
subset = "validation",
seed = 1,
color_mode = 'grayscale',
shuffle = True)
找到属于 3036 个类的 607200 个文件。 使用 182160 个文件进行验证。
但是我不确定如何在保持适当的类的同时进一步将我的验证拆分为测试拆分。据我所知(通过 GitHub source code),take 方法只获取数据集的前 x 个元素,skip 也是如此。我不确定这是否保持了数据的分层,并且我不太确定如何从数据集中返回标签来测试它。
任何帮助将不胜感激。
【问题讨论】:
标签: python tensorflow keras